Blacklists UT1

For english version

Contexte

L'Université Toulouse 1 Capitole diffuse depuis quelques années une liste noire d'URLs, gérée par Fabrice Prigent afin de permettre un meilleur contrôle de l'utilisation d'Internet. Cette base, largement utilisée par les écoles, peut s'intégrer dans un grand nombre d'outils libres ou commerciaux, en complément d'autres listes.
Avec le temps le nombre de catégories a fortement augmenté, et leur rôle a changé. La liste que nous fournissons doit être vue comme une catégorisation des sites, plus que comme une liste à bloquer. Par exemple N'oubliez pas que vous pouvez (devez ?) utiliser une catégorie "locale" qui permettrait d'adapter le comportement de votre filtrage. Ainsi les blogs peuvent être interdits de manière générale, mais certains doivent être autorisés pour des raisons pédagogiques.

La licence d'utilisation

Contrat Creative Commons
Cette création est mise à disposition sous un contrat Creative Commons.

Description

Plusieurs catégories sont définies, mais c'est surtout le pornographique qui est activement maintenu.
Pour ceux qui veulent une base de "travail". Je ne mets à jour régulièrement que la base adult qui nous est la plus utile. Si certains d'entre vous décidaient de compléter les autres bases, je me ferais un plaisir de les intégrer dans la mise à jour.
J'ajoute à l'heure actuelle entre 50 et 300 urls par jour (il faut faire des vérifications sur certaines urls) : je ne peux absorber que lentement les ajouts que fait mon robot d'exploration. Veuillez m'en excuser.
Il existe un fichier regroupant toutes les catégories : blacklists.tar.gz C'est la compilation des bases qui sont décrites ci-dessous :
CatégorieNombreDescription
adult971363 Des sites adultes allant de l'érotique à la pornographie dure.
agressif331 Quelques sites raçistes, antisémites, inçitant à la haine.
audio-video1878 Quelques sites orientés vers l'audio et la vidéo.
blog420 Quelques sites hébergeant des blogs.
cleaning171 Sites pour désinfecter et mettre à jour des ordinateurs.
dangerous_material36 Sites décrivant des moyens de créer du matériel dangereux (explosif, poison, etc.).
drogue897 Drogue.
financial72 Informations financieres, bourses.
forums200 Forums.
gambling669 Sites de jeux en ligne, casino, etc.
hacking290 Sites de piratage et d'agressions informatiques.
liste_bu2110 Une liste trés "univ-tlse1.fr" de sites éducatifs pour notre bibliothèque.
mobile-phone31 Sites pour les mobiles (sonneries, etc.).
phishing63560 Sites de phishing, de piéges bancaires, ou autres.
publicite1254 Publicité.
radio130 Sites de radio sur Internet
redirector42937 Quelques sites qui permettent de contourner les filtres.
strict_redirector42720 Comme redirector, mais avec les moteurs de recherche classiques.
strong_redirector42720 Comme strict_redirector, mais, pour google et autres, on ne bloque que certains termes.
tricheur33 Sites qui expliquent comme tricher aux examens.
warez686 Sites de logiciels pirates.
webmail85 Webmail que l'on trouve sur internet (hotmail, webmail.univ-tlse1.fr, etc.)
games7729 Sites de jeux, en ligne, ou de distributions de jeux.
mixed_adult107 Sites qui contiennent des portions adultes non structured
filehosting695 Sites qui hebergent des contenus (video, images, son)
reaffected8 Sites qui ont change de proprietaire et donc de contenu
sexual_education9 Sites qui parlent d education sexuelle et qui peuvent etre detectes comme pornographiques
shopping126 Sites de vente et achat en ligne
dating3082 Sites de rencontres
marketingware179 Sites de marketing tres speciaux
astrology24 Astrologie
sect145 Secte
celebrity609 Tout ce qui concerne l actualite dite people
manga546 Tout ce qui est lié à l'univers des mangas et de la bande dessinée
child16 Tout ce qui est autorisé pour des enfants
malware181780 Tout site qui injecte des malwares
press36 Tout site de presse d'information
chat200 Site de dialogue et conversation en ligne.
remote-control12 Site permettant la prise de controle a distance
Ces listes ont certainement quelques incohérences. Si vous en trouvez signalez le moi fabrice.prigent@univ-tlse1.fr ou bien utilisez l'interface suivante. http://cri.univ-tlse1.fr/cgi-bin/squidguard_modify.cgi.

La constitution des bases

La constitution des bases est faite par le biais de 2 moyens :

Les contributeurs

Cette base n'existe que par le travail de bénévoles, dont plusieurs étrangers. Ceci confère à la base une utilité internationale.

D'autres bases

D'autres personnes maintiennent des bases de données disponibles :

Télécharger la base

Plusieurs moyens sont disponibles :

Autres informations