Home About us Products Services Contact us Bookmark
:: wikimiki.org ::
URI

URI

Un URI, de l'anglais Uniform Resource Identifier, soit littéralement identifiant uniforme de ressource, est un protocole mis en place pour le World Wide Web qui normalise la syntaxe de courtes chaînes de caractères désignant un nom ou une adresse d'une ressource, physique ou abstraite. L'IETF l'a d'abord défini dans la RFC 2396 en se basant sur des propositions de Tim Berners-Lee. Mise à jour par la RFC 2732 puis révisée de nombreuses fois sous le titre rfc2396bis, la RFC 3986 définit l'URI en janvier 2005. Le sigle URI est généralement utilisé pour désigner une telle chaîne de caractères. Par exemple urn:ietf:rfc:2396 est un URI identifiant le RFC 2396. Les URI sont la technologie de base du World Wide Web car tous les hyperliens du Web sont exprimés sous forme d'URI. Les exemples suivants illustrent les URI d'usage courant :
- ftp://ftp.is.co.za/rfc/rfc1808.txt : schéma ftp pour le service FTP
- gopher://spinaltap.micro.umn.edu/00/Weather/California/Los%20Angeles : schéma gopher pour les services Gopher et Gopher+
- http://www.math.uio.no/faq/compression-faq/part1.html : schéma http pour le service HTTP
- mailto:mduerst@ifi.unizh.ch : schéma mailto pour les adresses électroniques
- news:comp.infosystems.www.servers.unix : schéma news pour les newsgroups Usenet
- telnet://melvyl.ucop.edu/ : schéma telnet pour les services interactifs via le protocole telnet

Voir aussi

Liens internes

URL ~ URN ~ IETF ~ World Wide Web ~ Internet

Liens externes


- [http://www.w3.org/Addressing/ Définition officielle du W3C]
- [http://www.ietf.org/rfc/rfc2396.txt RFC décrivant la syntaxe générique des URI] Catégorie:World Wide Web ko:URI ja:Uniform Resource Identifier

Anglais

L'anglais est une langue germanique originaire d'Angleterre. C'est la langue maternelle ou l'une des langues des habitants de plusieurs pays, surtout le Royaume-Uni et ses anciennes colonies, dont les États-Unis, l'Irlande, le Canada, l'Australie, et la Nouvelle-Zélande. L'anglais est l'une des langues les plus parlées au monde : elle est la troisième en nombre de locuteurs natifs, et la première apprise comme seconde langue. Elle est aussi la langue la plus utilisée sur Internet.

Histoire

L'anglais descend de la langue parlée par les tribus germaniques angles (d'où est tiré le nom de la langue), saxonnes et jutes s'étant installées en Grande Bretagne au de l'ère chrétienne, remplaçant les langues celtiques présentes sur le territoire. Ces dialectes germaniques, qui ont connu la première mutation consonantique, sont alors désignés sous le nom de vieil anglais, d'abord écrit en runes puis avec l'alphabet latin, apporté par les scribes irlandais au . L'influence d'envahisseurs vikings installés au nord-est du pays est notable dans le lexique de la langue qui a alors emprunté de nombreux termes au vieux norrois (ou « vieil islandais »). L'influence du latin, langue liturgique du christianisme que les scribes irlandais ont apporté, est aussi très forte. On arrête le vieil anglais au , à l'issue de la bataille de Hastings, en 1066. L'épopée Beowulf est écrite dans cet état de la langue. Après sa victoire à Hastings sur les Saxons, Guillaume le Conquérant s'installe en Grande-Bretagne et impose sa langue, le normand (langue d'oïl de l'ancien français), comme langue de la cour ; ce faisant, il modifie profondément la langue anglaise : les emprunts se font très nombreux et souvent doublonnent avec des mots de radical germanique. Le mot saxon est parlé par le peuple, alors que le terme français est souvent lié au registre soutenu ou à la parlure des nobles. Par exemple, ox, calf ou sheep, termes germaniques, représentent chez le producteur ─ anciennement les couches populaires de la population ─ ce que le consommateur ─ autrefois les couches aisées de la population ─ désigne par beef (cf. bœuf), veal, (cf. veau) et mutton (cf. mouton). (Ainsi, ces trois derniers mots désignent surtout la viande par opposition au bétail sur pied; mais on a aussi "let's return to our muttons" "retournons à nos moutons" et fig. "muttonhead", "mouton [de Panurge]". Par contre, "oxtail soup" car à l'origine ce potage était un plat plébéien.) D'autre part, la langue simplifie ses déclinaisons. C'est le moyen anglais, dont l'orthographe est fortement influencée par celle des scribes normands, lesquels inventent par exemple les digrammes de la langue (ch, sh, gh, th) et introduisent la lettre w (anciennement un digramme vv ou uu), faisant ainsi sortir de l'usage des lettres anciennes comme þ (thorn, remplacé par th), ð (edh, remplacé aussi par th), ȝ (yogh, proche d'un 3, remplacé par gh ou y principalement) ou ƿ (wynn, proche d'un p, remplacé par w). Les Contes de Cantorbéry de Geoffrey Chaucer sont écrits en moyen anglais. La grande mutation vocalique, qui a vu la modification en profondeur des voyelles anglaises, du marque le tournant d'un autre état de la langue, l'anglais moderne, que l'on fait réellement commencer au début du avec William Shakespeare. On y distingue deux sous-périodes : l'anglais moderne d'avant ou après le , quand, à la suite des conquêtes britanniques, la langue s'est de nouveau lexicalement enrichie de manière notable grâce aux emprunts faits aux langues des colonies.

Influence de l'anglais

Historiquement, l'anglais a peu pénétré le français (moins de 4 % du vocabulaire est d'origine anglo-saxonne). Cependant son influence croît depuis une cinquantaine d'années du fait de la mondialisation des échanges commerciaux et technologiques, dominés par de grandes puissances parlant cette langue, le Royaume-Uni et les États-Unis notamment (voir « impérialisme linguistique »). C'est pourquoi l'utilisation de mots anglais est notable dans des secteurs comme l'informatique, les télécommunications ou l'économie, comme le fut l'italien jadis pour la musique. Un autre phénomène est lié à cet expansionnisme : l'anglais tend à être utilisé à la place d'autres langues. Ainsi le français était la langue privilégiée des relations diplomatiques et des relations contractuelles, l'influence des États-Unis a fait tomber cet usage en désuétude. L'anglais est aussi depuis 1951 la langue utilisée dans l'aviation, sur décision de l'OACI. Il a par ailleurs acquis dans le monde la place de langue la plus fréquemment utilisée dans les rencontres internationales, même si le multilinguisme reste la norme. Étant la première langue étrangère apprise dans le monde, il bénéficie d'une base unique de locuteurs dans tous les pays sur tous les continents. C'est enfin la seconde langue officielle de très nombreux États. Cette utilisation internationale de l'anglais, devenu une véritable lingua franca, inquiète nombre d'anglophones qui voient leur langue prendre les allures d'un pidgin simpliste coupé de ses subtilités et de son histoire.

Classification

L'anglais est une langue germanique, famille au sein de laquelle les langues vivantes les plus proches sont le frison et le scots mais qui, néanmoins, a subi à plusieurs reprises l'influence d'autres langues germaniques comme le vieux norrois, du latin et de diverses langues romanes, surtout le français, influence latino-romane que l'on ne remarque pas seulement dans les mots qui sont a priori des emprunts lexicaux (déjà vu ou rendez-vous, expressions françaises utilisées en anglais ; embargo de l'espagnol ; cupola, folio ou stiletto de l'italien), mais encore dans de très nombreux mots à étymon latin (comme expectexspectare, schoolschola, scuttlescutella, ou streetstrata).

Répartition géographique

Statut officiel

L'anglais est la première langue en Australie (anglais australien), Bahamas, Barbade (anglais carribéen), Bermudes, Dominique, Gibraltar, Grenade, Guyana, Jamaïque (anglais jamaïcain), Nouvelle-Zélande (anglais néo-zélandais), Antigua-et-Barbuda, Sainte-Lucie, Saint-Christophe-et-Niévès, Saint-Vincent-et-les Grenadines, Trinité-et-Tobago, Royaume-Uni (anglais britannique), et (sans reconnaissance officielle) aux États-Unis (anglais américain). L'anglais est aussi l'une des premières langues du Belize (avec l'espagnol), du Canada (anglais canadien) (avec le français), de l'Inde (hindi et anglais ainsi que 21 autres langues d'État), de l'Irlande (avec l'irlandais), du Singapour (avec le malais, le mandarin, le tamil et d'autres langues asiatiques) et de l'Afrique du Sud (avec le zoulou, le xhosa, l'afrikaans, et le sotho du nord). C'est la langue non officielle la plus utilisée en Israël. C'est la langue usuelle dans l'île de Saint-Martin. À Hong-Kong c'est une langue officielle et largement utilisée dans le monde des affaires. Il est appris dès le jardin d'enfants, et est la langue d'instruction de quelques écoles primaires, de nombreuses écoles secondaires et de toutes les universités. Un nombre substantiel d'étudiants acquièrent un niveau de locuteur natif. Cette langue y est si largement utilisée qu'il est inadéquat de dire qu'elle n'est qu'une seconde langue ou une langue étrangère. C'est une langue officielle, mais pas native au Cameroun, Fidji, Micronésie, Ghana, Gambie, Kiribati, Lesotho, Liberia, Kenya, Namibie, Nigeria, Malte, Îles Marshall, Pakistan, Papouasie-Nouvelle-Guinée, Philippines, Îles Salomon, Samoa, Sierra Leone, Swaziland, Tanzanie, Zambie et Zimbabwe.

Langues dérivées

L'anglais a donné naissance :
- à de nombreux pidgins et créoles.
- au Basic English, langue créée par C. K. Ogden and I. A. Richards en 1930. Celle-ci ne comporte plus que 850 mots : ceux qui sont indipensables à la vie quotidienne (expression de sentiments inclus) plus ceux nécessaires pour définir les autres le temps d'une conversation.
- L'anglais Européen : http://www.davytech.com/wiki/

Écriture

L'anglais utilise l'alphabet latin (avec, anciennement, des lettres comme ð ou þ ; voir plus haut). Il n'utilise des signes diacritiques que pour écrire les mots d'origine étrangère. Son orthographe découle d'un long processus historique et il n'y a souvent plus de bijection entre celle-ci et la prononciation actuelle.

Prononciation

Parmi les consonnes n'existant pas en français, on peut noter [θ] et [ð], écrits th, ou encore [ŋ], écrit n devant un g ou un k. Exemples de mots :

Grammaire

Voir article détaillé : Grammaire anglaise L'anglais ne comporte pas de genres pour les noms (à part de rares exceptions). Les adjectifs sont invariables.

Conjugaison

Voir article détaillé : Conjugaison anglaise

Lexique

Des mots sont entrés dans la langue anglaise au contact avec le français : ils sont pour ces raisons très proches, à l'écrit, de leur homonyme. Ces mots existent dans la langue anglaise depuis si longtemps que les anglophones ne les considèrent plus comme mots français. Par exemple : difference, introduction, village, pure. En revanche, l'anglais a gardé des mots tels que mushroom, budget et (an) apron dont l'on ne reconnaîtrait guère l'origine française (respectivement liés à mousseron, bougette et napperon par métanalyse).

Nombre de mots

Contrairement à d'autres langues, il n'existe pas d'organisme qui recense officiellement les mots d'anglais. Comme par ailleurs l'importance actuelle de cette langue dans la recherche scientifique fait que de nombreux mots sont créés tous les jours (certains promis à une large diffusion, d'autres resteront d'usage confidentiel), il n'existe pas de liste complète. On peut simplement constater que le dictionnaire Oxford English Dictionary, un des plus complet, recense plus de 500.000 entrées, y compris des mots désuets, des mots techniques et des mots de dialectes locaux.

Origine des mots

En 1973, Thomas Finkenstaedt et Dieter Wolff, en se basant sur les 80.000 mots du Shorter Oxford Dictionary (3e édition), ont établi la répartition suivante :
- français, y compris l'ancien français et le normand (ou anglo-français) : 28,3 %
- latin, y compris les mots scientifiques et techniques récents : 28,24 %
- ancien et moyen anglais, vieux norrois et hollandais : 25 %
- grec : 5,32 %
- étymologie indéterminée : 4,03 %
- mots dérivés de noms propres : 3,28 %
- toutes les autres langues : moins de 1 % Cependant, les problèmes de définition conduisent à des appréciations divergentes. Ainsi la linguiste française Henriette Walter affirme de son côté que [http://perso.wanadoo.fr/mondalire/Henriette_walter.htm plus des deux tiers des mots anglais sont d'origine française].

Emprunts à l'anglais

Le sens des mots peut avoir changé entre les deux langues. Certains de ces mots sont des allers-retours, car empruntés initialement au français.

avec la forme anglaise


- badge
- basket
- boss, « chef, patron »
- budget, de l'ancien français « bougette », petite bourse portée à la ceinture
- caddie, chariot tiré à bras utilisé pour transporter de menus objets
- check-up
- club
- coach (prononc. « cooutch ») et ses dérivés (coacher, le coaching)
- cool
- cowboy, qui signifie « vacher »
- fair-play
- ferry(-boat)
- fuel, de l'ancien français « fouaille », matière servant à alimenter un feu
- gag,
- gentleman, partiellement de l'ancien français « gentil », homme d'ascendance noble
- job, qui signifie « travail, activité rémunérée »
- milk-shake
- one-man show, spectacle mené par un seul artiste
- self-control, littéralement : la maîtrise de soi
- self-made man, littéralement : personne qui a fait elle-même sa réputation, sa carrière
- self-service, endroit où on se sert soi-même (distributeurs de carburant, restaurants d'entreprise, cafétéria, etc.)
- show
- skateboard
- spot
- steak
- stock-options
- toast, de l'ancien français « toster » (griller)
- week-end, qui signifie « fin de semaine »
- Nom de sports créés aux XIX et XX siècles : En général, ces sports ont un vocabulaire spécifique lui aussi composé de mots anglais. On trouve aussi des termes transverses : un match, un set, un derby, un supporter. :
- (boxe) : ring, uppercut, swing :
- football (la « balle au pied »), goal, penalty :
- basket-ball ((la « balle au panier ») :
- rugby (du nom de la ville où ce jeu a été inventé), drop :
- hockey :
- golf, tee, club, green, put, caddie :
- (planche à voile) : wishbone :
- rallye :
- surf :
- tennis (du moyen français « tenez ! », expression utilisée pour démarrer une partie au jeu de paume) Attention : le mot handball, bien qu'homographe parfait entre l'anglais et l'allemand, est originaire d'Allemagne. C'est pourquoi sa syllabe finale se prononce [bal] et non [bo:l].
Musique :
- country
- blues
- boogie woogie
- jazz
- rock'n'roll
- ragtime
- rhythm'n blues
- swing
- folk

francisés


- bouledogue (bulldog)
- fioul (écriture phonétique de la prononciation anglaise de fuel)
- paquebot (packet-boat)
- redingote (riding-coat, vêtement pour les sorties à cheval)
- bifteck (beef steak)

mots de racine anglo-saxonne

La langue française a créé de nombreux substantifs en ajoutant la terminaison « ing » à des mots anglais.
- camping
- forcing
- marketing
- packaging
- parking
- reporting
- shampooing

Divers


- code ISO 639-1 : en

Voir aussi

Liens internes


- linguistique
  - grammaire anglaise
    - verbes irréguliers en anglais
    - Conjugaison anglaise
  - faux-amis anglais
  - vrais amis en anglais
  - anglicisme
  - franglais
  - variations régionales de l'anglais
  - linguistes anglais
  - dictionnaire des langues
    - langues par famille
      - langues indo-européennes
      -
- langues germaniques
      -
  - langues germaniques occidentales
      -
    - groupe anglo-frison

Liens externes


- [http://www.websters-online-dictionary.org/definition/French-english/ Dictionnaire français - anglais] Webster's Rosetta Project
- [http://www.scientificpsychic.com/verbs1fr.html Conjugueur des verbes anglais]
- [http://www.freelang.com/dictionnaire/anglais.html Dictionnaire Freelang anglais téléchargeable] Dictionnaire Freelang anglais-français/français anglais de Bertrand Cornu
- [http://anglais.linguistmail.com Linguistmail.com] Outils gratuits pour apprendre l'anglais
- [http://fr.wordreference.com WordReference.com], dictionnaire en ligne anglais-français
- [http://linearb.co.uk:8080/memory/ Dictionnaire français-anglais plus exemples phrases] Linear B

Bibliographie


- L'aventure des langues en occident, Henriette Walter, Editions Robert Laffont, 1994, le chapitre concernant les langues germaniques
- Honni soit qui mal y pense, Henriette Walter, Editions Robert Laffont, 2001, sur les allers-retours de mots entre l'anglais et le français Catégorie:Anglais Catégorie:Langue germanique Catégorie:Langue officielle de l'Union européenne Catégorie:Langue véhiculaire Anglais als:Englische Sprache ja:英語 ko:영어 ms:Bahasa Inggeris simple:English language th:ภาษาอังกฤษ zh-min-nan:Eng-gí

Standard industriel

Catégorie:Normalisation Une norme industrielle est un référentiel publié par un organisme de normalisation officiel par exemple AFNOR, CEN, ISO. Les organismes de normalisation sont des organismes officiels, reconnus au niveau national par leurs états, au niveau international par des traités ou par la réunion d'organismes nationaux. Comme les Anglais ne font pas la différence entre norme et standard (« norme » se dit « standard »), on parle pour les normes de standards de jure. Un standard est un référentiel publié par une entité privée. En fait on ne parle de standard qu'à partir du moment où le réferentiel a une diffusion large, on parle alors de standard de facto, en informatique les formats HTML ou de fichier Microsoft Word en sont des exemples très connus. Un standard/une norme est ouvert, quand le référentiel est diffusé librement (pas obligatoirement gratuitement), le format HTML est l'exemple le plus frappant. Les standards ouverts sont en général publiés par des organismes à but non lucratifs par exemple le W3C et l'IETF sous forme de recommandations. Une recommandation peut être reprise comme une norme. Le contenu d'une norme/standard peut être protégé par des droits de propriété intellectuelle en plus de ceux de l'éditeur de la norme/standard. Pour les normes, dans un tel cas, le propriétaire des droits s'engage à vendre ses droits à tout le monde à un tarif raisonnable et non discriminatoire (c'est approximativement les termes employés dans les normes AFNOR et ISO), les spécifications autour des disques compacts (CD) dont les brevets initiaux étaient la propriété de Philips et Sony et qui ont donné lieu à publications de normes. Un standard/norme est fermé quand le référentiel n'est pas diffusé (théoriquement, il est imaginable qu'une norme nationale soit fermée car réservée aux ressortissants de ce pays), le format de fichier de Microsoft Word est l'exemple le plus frappant. Dans le cas général, un fabriquant ou un prestataire de service n'est pas obligé de suivre une norme. Dans certains cas, les règlements (décrets en France, directives européennes) peuvent imposer l'utilisation d'une norme (par exemple normes pour les installations électriques, les jouets pour enfants, les appareils à pression...).

Normes en France

Selon le décret 84-74, :« La normalisation a pour objet de fournir des documents de référence comportant des solutions à des problèmes techniques et commerciaux concernant les produits, biens et services qui se posent de façon répétée dans des relations entre partenaires économiques, scientifiques, techniques et sociaux. » Voir aussi : Norme Française

Voir aussi

[ Interopérabilité | Organisme de normalisation | Organisation internationale de normalisation | Internet Engineering Task Force | World Wide Web Consortium | Ecma International ]

Bibliographie


- Décret 84-74 du 26 janvier 1984 (JORF du 1 février 1984) fixant le statut de la normalisation, modifié

IETF

L'Internet Engineering Task Force, abrégée IETF, littéralement traduit de l'anglais en « Détachement d'ingénierie d'Internet » est un groupe informel, international, ouvert à tout individu, qui participent à l'élaboration de standards pour Internet. L'IETF produit la plupart des nouveaux standards d'Internet.

Structure

L'IETF est un groupe informel, sans statut, sans membre, sans adhésion. Le travail technique est accompli dans une centaine de groupes de travail. En fait, un groupe est généralement constitué d'une liste de courrier électronique. L'IETF tient trois réunions par année. Les groupes de travail sont répartis dans une dizaine de domaines d'intérêt, chaque domaine ayant un ou deux directeurs. Ces directeurs de domaine nomment le ou les directeurs de chaque nouveau groupe de travail. Les directeurs de domaine font partie de l'Internet Engineering Steering Group (IESG). L'Internet Architecture Board (IAB) se charge de l'orientation à long terme d'Internet, et donc des activités données à l'IETF. L'IESG et l'IAB sont chapeautés par l'Internet Society (ISOC).

Production

Le but du groupe est généralement la rédaction d'un ou plusieurs Request for comments (RFC), nom donné aux documents de spécification à la base d'Internet.

Voir aussi

Liens internes

[ Request for comments | Internet Society | Internet Engineering Steering Group | Internet Architecture Board | Internet Assigned Numbers Authority | Internet | Normes et standards industriels ]

Liens externes


- [http://www.ietf.org/ Site officiel] (en anglais) ;
- [http://www.isoc-gfsi.org/ietf/tao.html Le Tao de l'IETF], un guide pour la participation aux travaux de l'Internet Engineering Task Force, traduction du RFC 3160 ;
- RFC 2028, The Organizations Involved in the IETF Standards Process, octobre 1996. Catégorie:Organisme de normalisation Catégorie:Internet ja:Internet Engineering Task Force ko:IETF

Tim Berners-Lee

Tim Berners-Lee (né le 8 juin 1955) est l'inventeur du World Wide Web. Il préside aujourd'hui le World Wide Web Consortium (W3C).

Biographie

Né à Londres le 8 juin 1955, fils de Conway Berners-Lee et de Mary Lee Woods, Tim fait des études à l'Université d'Oxford de 1973 à 1976. Il profite de ces années pour fabriquer son premier ordinateur à partir d'un Motorola 6800 et d'une vieille télévision. De 1976 à 1980, il travaille pour diverses entreprises anglaises. En 1980, alors qu'il travaille comme consultant extérieur au CERN à Genève, il écrit un premier logiciel de stockage d'informations utilisant des associations aléatoires. Ce projet qu'il avait nommé « Enquire » est mis au placard, mais c'est lui qui servira de base plus tard au World Wide Web. De 1981 à 1984, il travaille pour le compte d'une entreprise sur les systèmes distribués à temps réel. Il revient ensuite au CERN. En 1989, il propose le projet de système hypertexte qui deviendra le World Wide Web. En 1990 le trois principales technologies du Web (URL, HTTP, HTML) sont en place et le premier serveur HTTP et navigateur Web sont créés. Pendant 3 ans, de 1991 à 1993, il continue à développer et populariser le Web, au CERN, dans la communauté de la physique des particules, et dans le monde. En décembre 1994 il quitte le CERN pour le Massachusetts Institute of Technology, où il occupe la chaire 3Com (Computer Communication Compatibility) au Laboratory for Computer Science (LCS) du Massachusetts Institute of Technology. Il créée et dirige également le World Wide Web Consortium. En mai 2001, il développe l'idée même du Web en présentant un article concernant le web sémantique: "A new form of Web content that is meaningful to computers will unleash a revolution of new possibilities" http://www-sop.inria.fr/acacia/cours/essi2006/Scientific%20American_%20Feature%20Article_%20The%20Semantic%20Web_%20May%202001.pdf Le 23 août 2005, il est reconnu par le gouvernement allemand qui a décidé de lui décerner le prix Quadriga en tant que « l'un des deux plus importants scientifiques du , aux côtés d'Albert Einstein ». Tim vit actuellement à Boston, Massachusetts, avec sa femme et ses deux enfants.

Liens externes


- Proposition originale au CERN par Berners-Lee : http://www.w3.org/History/1989/proposal.html
- Le livre de Tim Berners-Lee Weaving The Web (« En tissant la toile ») avec des détails des vues de l'auteur sur l'histoire et le futur du Web http://www.w3.org/People/Berners-Lee/Weaving/Overview.html
- Page de Tim Berners-Lee au W3C : http://www.w3.org/People/Berners-Lee/ ---- Cet article, ou une version antérieure de cet article, est (en partie) basé sur un article [http://www.themanualpage.org/internet/internet_berners.php3] du site [http://www.themanualpage.org/ The Manual Page]. Le document d'origine est sous double licence GPL/GFDL. Berners-Lee, Tim Berners-Lee, Tim ja:ティム・バーナーズ=リー ko:팀 버너스리

Sigle


-
Un sigle est un ensemble de lettres initiales formant un mot servant d'abréviation. Si le mot peut se prononcer, comme par exemple Unesco, on dit que c'est un acronyme. Dans les autres cas, on l'épelle, par exemple RATP, er-a-té-pé, ou SNCF, éss-én-cé-éf. Dans cet esprit, Marcel Duchamp a intitulé son tableau copié de la Joconde : L.H.O.O.Q. Remarquez que dans le dernier cas, on écrira l'abréviation avec des points après les lettres, ce qu'on ne fera pas dans le premier cas. Mais dans l'usage courant, la tendance est à la suppression des points pour tous les sigles. Certains sigles courants entraînent la formation de dérivés, par exemple : cégétiste (membre de la CGT), érémiste (bénéficiaire du RMI). Certains sigles sont aussi écrits tels qu'on les prononce, devenant ainsi des noms communs (et s'accordent donc en genre et en nombre), par exemple : une bédé, des bédés, un cédérom, des cédéroms, un pédégé, une pédégée. Les sigles sont invariables en français et ne prennent pas la marque du pluriel (contrairement à l'usage anglo-saxon), par exemple : des BD, des CD, des HLM, des CRS.

Typographie

L'usage en France, et sur le Wikipédia francophone, est d'écrire un sigle en lettres capitales sans point d'abréviation.

Voir aussi


- Liste de sigles
- Sigles en espagnol
- Abréviations en informatique
- Sigles en économie
- Sigles de deux lettres
- Sigles en télécommunications

Liens externes


- [http://www.educnet.education.fr/documentation/guide/sigles.htm Répertoire de sigles] (ministère de l'Éducation nationale).
- [http://www.ac-toulouse.fr/html/_74_131_137_1666_.php Sigles et abréviations] (Inspection académique des Hautes-Pyrénées).
- [http://www.sigles.net/ Sigles.net] (Dictionnaire de sigles et acronymes).
- [http://www.educnet.education.fr/dossier/rechercher/sigle.htm Autres sources de répertoires spécialisés] (ministère de l'Éducation nationale).
- [http://qqcvd.webiciel.com/index.php?init=A Qu'est-ce que ça veut dire ?]

Hyperlien

ko:하이퍼링크 ja:ハイパーリンク simple:Link Catégorie:Internet Un hyperlien ou lien hypertexte ou simplement lien, est une référence dans un système hypertexte permettant de passer automatiquement d'un document consulté à un document lié.

Source et destination

Un hyperlien a une source (ou origine) et une destination (ou cible). L'activation de l'élément source d'un hyperlien permet de passer automatiquement à sa destination. La source d'un hyperlien est généralement un élément (mots, phrases, images) d'un document hypertexte. La destination peut être un autre élément du même document, il s'agit alors d'un hyperlien interne au document. La destination peut également être un autre document, voire un élément précis d'un autre document. Un hyperlien est bidirectionnel si sa destination est aussi la source réciproque du même lien. Sinon un lien est unidirectionnel et rien ne distingue un élément destination d'un quelconque autre élément. La destination d'un hyperlien n'est pas forcément un document hypertexte. Le cas échéant, le lien sera forcément unidirectionnel.

World Wide Web

Les hyperliens du World Wide Web se trouvent dans les pages Web, plus précisément dans des documents écrits en langage HTML (Hypertext Markup Language). Les pages Web utilisent la notation des URI (Uniform Resource Identifier) pour identifier les documents référencés. Les hyperliens du Web sont unidirectionnels. Ceci a deux avantages pour le Web. Premièrement cela permet d'utiliser des documents non hypertextes (notamment des sons, des images, des documents à imprimer) comme destination. Deuxièmement cela permet d'établir des hyperliens vers toutes les ressources accessibles d'Internet, sans coordination avec le responsable du document de destination. Le défaut de cette non coordination est que les changements du document de destination risquent de rendre le lien obsolète sans que le responsable de la source ni de la destination de s'en rendent compte. Le problème le plus visible apparaît lorsque le document de destination est supprimé : le lien est alors « brisé », il fait référence à un document disparu. La technique à la base des hyperliens du Web est également utilisée pour inclure des images ou des sous-pages dans les pages Web. Une terminologie s'est développée pour différencier ces diverses applications de la technologie du Web :

Voir aussi

Articles connexes


- Hypertexte
- URL, URI
- Fair use
- Droit de citation
- HTML
- Site Web
- World Wide Web

Documents externes


- [http://www.w3.org/DesignIssues/LinkLaw Links and Law] et [http://www.w3.org/DesignIssues/LinkMyths.html Links and Law: Myths], point de vue de Tim Berners-Lee sur les hyperliens du Web.

File Transfer Protocol

Le File Transfer Protocol (protocole de transfert de fichiers) ou FTP est dédié à l'échange informatique de fichiers sur un réseau TCP/IP. Il permet, depuis un ordinateur, de copier des fichiers depuis ou vers un autre ordinateur du réseau, d'administrer un site web, ou encore de supprimer ou modifier des fichiers sur cet ordinateur. La mise en place du protocole FTP date de 1971, date à laquelle un mécanisme de transfert de fichiers (décrit dans la RFC 141) entre les machines du MIT avait été mis au point. De nombreux RFC ont ensuite apporté des améliorations au protocole de base, mais les plus grandes innovations datent de juillet 1973. Le protocole FTP est actuellement défini par la RFC 959.

Vue d'ensemble

FTP obéit à un modèle client-serveur, c'est-à-dire qu'une des deux parties, le client, envoie des requêtes auxquelles réagit l'autre, appelé serveur. En pratique, le serveur est un ordinateur sur lequel fonctionne un logiciel lui-même appelé serveur FTP, qui rend publique une arborescence de fichiers similaire à un système de fichiers Unix. Pour accéder à un serveur FTP, on utilise un logiciel client FTP (possédant une interface graphique ou en ligne de commande). Le protocole, qui appartient à la couche session du modèle OSI et à la couche application du modèle ARPA, utilise une connexion TCP. Il peut s'utiliser de deux façons differentes :
- en mode actif, c'est le client FTP qui détermine le port de connexion à utiliser pour permettre le transfert des données.Ainsi, pour que l'échange des données puisse se faire, le serveur FTP initiera la connexion de son port de données (port 20) vers le port spécifié par le client. Le client devra alors configurer son pare-feu pour autoriser les nouvelles connexions entrantes afin que l'échange des données se fasse. Ce mode est donc moins sécurisé que le FTP passif pour le client. De plus il peut s'avérer problématique pour les utilisateurs essayant d'accéder à des serveurs FTP lorsqu'ils sont derrière une passerelle NAT. Vu la façon dont fonctionne la NAT, le serveur FTP initie la connexion de données en se connectant à l'adresse externe de la passerelle NAT sur le port choisi. La passerelle NAT n'ayant pas de correspondance pour le paquet reçu dans sa table d'état le paquet sera ignoré et ne sera pas délivré au client.
- en mode passif, le serveur FTP détermine lui même le port de connexion à utiliser pour permettre le transfert des données (data connexion) et le communique au client. Dans le cas de l'existence d'un pare-feu devant le serveur FTP celui-ci devra être configuré pour autoriser la connexion de données. L'avantage de ce mode, est que le serveur FTP n'initie aucune connexion. Dans le cas des clients FTP sur un réseau local, ce mode est beaucoup plus sécurisé que le ftp actif, car le pare-feu ne devra laisser passer que les flux sortant vers internet pour permettre aux clients d'échanger des données avec le serveur. Deux ports sont standardisés (well known ports) pour les connexions FTP : 21 pour la connexion de commandes et 20 pour la connexion data.

Commandes FTP

Cette section décrit le fonctionnement des commandes FTP d'une façon générale, et ensuite chacune des commandes individuellement.

Fonctionnement

Lors d'une utilisation classique, le client se connecte au serveur, s'identifie, puis travaille sur les répertoires distants. Toute commande envoyée par le client fait de 3 à 4 lettres (en lettres majuscules) suivies éventuellement d'un espace et d'informations. Lorsque le serveur reçoit une requête, il doit automatiquement répondre par un nombre de 3 chiffres suivi d'un espace, puis de texte commentaire. Pour plus d'informations sur les réponses du serveur, voyez la page qui leur est consacrée sur le site [http://www.commentcamarche.net/internet/ftp.php3 Comment ça marche? ].

Commandes principales

;USER : USER : « Utilisateur » - Ouvre une session FTP avec le nom d'utilisateur . En FTP anonyme, taper « anonymous » ou rien du tout (dépend des serveurs FTP). ;PASS : PASS : « Mot de passe » - représente le mot de passe de l'utilisateur . En FTP anonyme, taper « anonymous » ou votre adresse électronique. ;CWD : Change Working Directory : « Changer le répertoire de travail » - Change le répertoire de travail. doit être le chemin du nouveau répertoire depuis la racine du serveur (Chemin absolu). ;CDUP : Change Directory UP : « Changer de répertoire vers le haut » - Change le répertoire de travail et l'établit sur le dossier parent. ;PWD : Print Working Directory : « Imprimer le répertoire courant » - Récupère le chemin sur le serveur du dossier courant. ;LIST : LIST : « Liste » - Liste les fichiers présents dans le répertoire courant du serveur. ;STAT : STATus : « Status » : Permet de s'informer sur l'état du serveur. Elle peut servir à connaître l'avancement d'un transfert en cours et accepte en argument un chemin d'accès, elle retourne alors les mêmes informations que LIST mais sur le canal de contrôle. ;HELP ou « ? »: HELP : « Aide » - Permet de connaître toutes les commandes que le serveur accepte (Informations retournées sur le canal de contrôle). ;DELE : DELete : « Supprimer » - Supprime le fichier , le chemin devant être donné par rapport à la racine du serveur distant. ;RMD : ReMove Directory : « Supprimer répertoire » - Supprime , le chemin devant être donné par rapport à la racine du serveur distant. ;RNFR : ReName FRom : « Renommé depuis » - 1ère étape pour renommer un fichier. ;RNTO : ReName TO : « Renommé en » - 2ème étape pour renommer un fichier. ;MKD : MaKe a new Directory : « Faire un nouveau dossier » - Crée un nouveau répertoire dans le dossier courant. ;QUIT : QUIT : « Quitter » - Permet de quitter le serveur. ;GET : GET : « Obtenir » - Récupère du répertoire distant courant pour le sauvegarder dans le répertoire local. ;MGET : Multiple GET - Récupère un ensemble de fichiers définis par le . Exemple : MGET
- .tgz qui défini l'ensemble des fichiers dont l'extension est tgz. ;PUT : PUT : « Mettre » - Envoie dans le répertoire courant du serveur. ;MPUT : Multiple PUT - Envoi un ensemble de fichiers définis par le . Exemple : MPUT
- .tgz qui envoi l'ensemble des fichiers dont l'extension est tgz.

Autres commandes ftp

;ABOR : ABORt : « Annuler » - Indique au serveur DTP d'abandonner tous les transferts associés à la commande précédente. Si aucune connexion de données n'est ouverte, le serveur DTP ne fait rien, sinon il la ferme. Le canal de contrôle reste toutefois ouvert. ;ACCT : ACCounT : Compte - Ouvre une session FTP avec le nom d'utilisateur . Si la réponse est 332, il faut envoyer le mot de passe. Si la réponse est 230, la connexion est réussie. ;ALLO : ALLOcate : « Allouer » - Cette commande demande au serveur de prévoir un espace de stockage suffisant pour contenir le fichier dont le nom est passé en argument. ;APPE : APPEnd : - Concaténations des données envoyées dans le fichier portant le nom s'il existe déjà, sinon dans un nouveau fichier . ;MODE : Précision du mode de transfert des données (S pour Stream, B pour Block, C pour Compressed). ;NLST : Name LiST : « Liste des noms » - Retourne la liste des fichiers et des répertoires dans le répertoire distant courant. ;NOOP : NO OPeration : « Pas d'opérations » - Sert uniquement à obtenir une commande OK du serveur, pour ne pas être déconnecté après un temps d'inactivité trop élevé. ;PASV : PASsiVe mode - Commande permettant d'indiquer au serveur DTP de se mettre en attente une connexion sur un port spécifique choisi aléatoirement parmi les ports disponibles. La réponse à cette commande est l'adresse IP de la machine et le port. ;PORT i1,i2,i3,i4,p1,p2 : Précise le port (p1
- 256+p2) et l'adresse ip (i1.i2.i3.i4) auxquels le serveur devra se connecter pour le transfert suivant. ;REST : RESTart : « Recommencer » - Reprends un transfert là où il s'est arrêté. Pour cela, cette commande envoie , représentant la position dans le fichier à laquelle le transfert avait été interrompu. Elle doit être immédiatement suivie d'une commande de transfert. ;SITE : Permet au serveur de proposer des services spécifiques, non définis dans le protocole FTP. ;SMNT : Structure Mount : ??? - ???. ;RETR : Cette commande (RETRIEVE) demande au serveur DTP une copie du fichier dont le chemin d'accès est passé en paramètre. ;STOR : Cette commande (store) demande au serveur DTP d'accepter les données envoyées sur le canal de données et de les stocker dans le fichier portant le nom passé en paramètre. Si le fichier n'existe pas, le serveur le crée, sinon il l'écrase ;STOU : Cette commande est identique à la précédente, si ce n'est qu'elle demande au serveur de créer un fichier dont le nom est unique. Le nom du fichier est retourné dans la réponse. ;STRU : Caractère Telnet précisant la structure du fichier (F pour File, R pour Record, P pour Page) ;SYST : SYSTem : « Système » - Permet de recevoir des informations sur le serveur distant. ;TYPE : Permet de préciser le type de format dans lequel les données seront envoyées.

Utilisation

Pour accéder a un serveur FTP on utilise un client ftp, en ligne de commande ou avec une interface graphique. Les utilisateurs de GNU-Linux ou d'un Unix peuvent consulter une documentation (la plupart du temps installée par défaut), en tapant « man ftp » La plupart des navigateurs récents autorisent les connexions FTP en utilisant une URL de type : :ftp://nom_d_utilisateur:mot_de_passe@nom_du_serveur:port_ftp Par sécurité, il est conseillé de ne pas préciser le mot de passe, le serveur le demandera. Cela évite de le laisser visible en clair ou réutilisable. La partie port_ftp est optionnelle. S'il est omis le port par défaut (21) sera utilisé.

Diagramme des flux

Image:Diagramme_des_Flux_de_FTP.png

Annexes


- Yafc
- Logiciels avec une interface graphiques pour utiliser le protocole FTP
  - Sous GNU/Linux
    - gftp http://gftp.seul.org/
  - Sous Microsoft Windows
    - FileZilla http://filezilla.sourceforge.net
- RFC 959 — File Transfer Protocol (FTP)
- RFC 1579 — Firewall-Friendly FTP
- RFC 2228 — FTP Security Extensions
- [http://pintday.org/whitepapers/ftp-review.shtml FTP Reviewed]

Voir également


- Internet
- CFT ---- Une petite partie de cet article est basée sur [http://www.commentcamarche.net/internet/ftp.php3 cette page]. Catégorie:Internet Catégorie:Protocole réseau Catégorie:Protocole réseau passant difficilement les pare-feux ja:File Transfer Protocol ko:FTP

Gopher

Catégorie:Protocole réseau Gopher, du nom de l'écureuil américain aussi appelé « spermophile », est un protocole de l'Internet. Mis au point par l'université du Minnesota pour la consultation d'informations organisées sous la forme d'une arborescence de menus hiérarchiques, il fonctionnait en mode caractère. Il a disparu parce que le protocole qu'il utilisait était la « propriété » de l'université du Minnesota, qui a menacé au printemps 1993 de réclamer des royalties. Son abandon a favorisé le développement de HTTP, le protocole à la base du Web qui, lui, est libre. ja:Gopher

HTTP

Catégorie:Protocole réseau Catégorie:World Wide Web Informatique > Protocole de communication > HTTP ---- Le Hypertext Transfer Protocol, abrégé HTTP, littéralement « protocole de transfert hypertexte », est un protocole de communication informatique client-serveur développé pour le World Wide Web. Il est utilisé pour transférer les documents (document HTML, image, feuille de style, etc.) entre le serveur HTTP et le navigateur Web lorsqu'un visiteur consulte un site Web. HTTPS (Secured) est la variante du HTTP sécurisé avec les protocoles SSL ou TLS. Il permet au visiteur de vérifier l'identité du site auquel il accède grâce à un certificat d'authentification. Il permet également de chiffrer la communication. Il est généralement utilisé pour les transactions financières en ligne : commerce électronique, banque en ligne, courtage en ligne, etc.

Fonctionnement

La RFC 2616 décrit le protocole HTTP. La RFC 2818 définit le protocole HTTPS. Le client (le plus souvent c'est un navigateur Web) envoie une requête au serveur afin de lui indiquer la ressource qu'il veut recevoir. Le serveur lui répond en conséquence.

Exemple

Ces en-têtes sont très simplifiés afin d'en comprendre le fonctionnement, mais ils peuvent être beaucoup plus importants, fournissant ainsi plus d'informations au client et/ou au serveur. Le client envoie : GET /index.html HTTP/1.1 Ce qui équivaut littéralement à : « Donne moi le contenu de la page index.html à la base de ton serveur sachant que je te parle en HTTP 1.1.» Le serveur lui renvoie alors : HTTP/1.1 200 OK Date: Sun, 05 Nov 2000 20:24:23 GMT Server: Apache/1.3.14 (Unix) PHP/4.0.3 Last-Modified: Sat, 03 Jun 2000 07:12:12 GMT Content-Length: 3069 Content-Type: text/html [...] Ce qui veut dire : « J'ai bien reçu ta requête, je suis un server de type , on est le et la dernière fois que la page a été modifié est le . Le contenu de la page fait octets et est de type . Voici le contenu: Voir aussi

Liens internes


- Serveur HTTP
- Navigateur Web
- World Wide Web
- Protocole de communication

Liens externes


- [http://www.w3.org/Protocols/rfc2616/rfc2616.html Référence officielle actuelle : HTTP 1.1, RFC2616, Juin 1999] (en anglais)
- [http://www.w3.org/Protocols/ Liste des spécifications du W3C et de l'IETF] (en anglais)
- [http://www.iprelax.fr/http/ Présentation de HTTP sur un site de vulgarisation]
- [http://www.themanualpage.org/http/ Autre bonne présentation de HTTP en français]
- [http://livehttpheaders.mozdev.org/ Extension LiveHTTPheaders pour Firefox] ja:Hypertext Transfer Protocol ko:HTTP th:HyperText Transfer Protocol

Adresse électronique

Une adresse de courrier électronique ou adresse électronique ou adresse (de) courriel ou adresse e(-)mail (franglais) est une chaîne de caractères identifiant une boîte de courrier électronique existant sur un réseau informatique. L'adresse électronique est parfois confondue avec l'adresse Web, qui est l'adresse d'un site Web.

Mél

La fausse abréviation Mél. (pour messagerie électronique) a été proposée1 par la Délégation générale à la langue française pour préfixer une adresse électronique sur une carte de visite ou un en-tête de lettre, comme on utilise Tél. pour indiquer un numéro de téléphone. Une déformation de celle-ci donne parfois lieu à l'usage impropre « adresse mèl ».

Sur Internet

Les adresses de courrier électronique utilisées sur Internet sont codées dans un nombre très limité de caractères2, sous-ensemble de l'ASCII. Un codage spécial appelé UTF-73, surtout utilisé en Asie, permet néanmoins de représenter tous les caractères Unicode en utilisant uniquement les caractères autorisés. Elles sont constituées des trois éléments suivants, dans cet ordre :
- un identificateur d'utilisateur, reprenant souvent le nom ou le pseudonyme d'une personne (Jean.Dupont, joe25317) ou un nom de service (info, vente, postmaster) ;
- le caractère séparateur @ (arrobe), signifiant « à » ou « chez » en anglais ;
- le nom de domaine de messagerie de la boîte (yahoo.fr, hotmail.com, gmail.com). Le nom de domaine sert à identifier le serveur de messagerie auquel doit être acheminé un message via le protocole SMTP. La transformation du nom de domaine en adresse IP se fait grâce au système de résolution de noms DNS. L'identificateur d'utilisateur est quant à lui local à ce serveur et identifie la boîte en tant que telle. Le même nom d'utilisateur peut donc exister sur deux serveurs différents, et joe25317@gmail.com n'est pas la même adresse que joe25317@hotmail.com (même si en pratique, ces deux boîtes peuvent appartenir à la même personne)

Déguisement contre le spam

Pour éviter que leur adresse puisse être reconnue par un robot d'indexation collectant des adresse à des fins de spam, certaines personnes déguisent leur adresse lorsqu'elles la donnent dans une page Web ou dans un message sur Usenet, par exemple :
- joe25317@NOSPAMgmail.com lorsqu'il faut que l'adresse conserve un format d'adresse valide ;
- joe25317 at gmail com lorsqu'il suffit que l'adresse soit reconnaissable par un humain.

Voir aussi

Liens internes

Courrier électronique ~ Client email ~ Mail Transfer Agent ~ SMTP ~ Spam ~ Internet

Liens externes


- [http://users.skynet.be/typographie/faq/Mel.html Jean-Pierre Lacroux sur « Mél.»]
- [http://www.lafitte-info.com/blog/index.php/2005/10/12/23-une-adresse-email-sur-internet Une adresse email sur internet.], par Hugo LAFITTE.

Outils Utiles


- [http://www.lafitte-info.com/blog/index.php/2005/11/05/47-protection-d-une-adresse-email-contre-le-spam Outil d'encodage d'adresses emails]

Références


- 1 [http://www.culture.gouv.fr/culture/dglf/mel.htm Mél.] sur le site de la DGLF
- 2 RFC 2822 Internet Message Format
- 3 RFC 1642 et RFC 2152 UTF-7: A Mail-Safe Transformation Format of Unicode Catégorie:courrier électronique ja:%E3%83%A1%E3%83%BC%E3%83%AB%E3%82%A2%E3%83%89%E3%83%AC%E3%82%B9

Newsgroups

Usenet, également connu sous le nom Netnews, est un système de forums de discussions qui fonctionne aujourd'hui sur Internet, mais qui a été inventé en 1979 pour fonctionner sur des ordinateurs reliés par UUCP.

Fonctionnement général

Usenet est un ensemble de protocoles servant à générer, stocker et récupérer des « articles » (des messages qui sont proches, dans leur structure, des courriels), et permet l'échange de ces articles entre les membres d'une communauté qui peut être répartie sur une zone potentiellement très étendue. Usenet est organisé autour du principe de groupes de discussion ou groupes de nouvelles (en anglais newsgroups), qui rassemblent chacun des articles (contributions) sur un sujet précis. Les sujets des groupes de discussion sont organisés selon une hiérarchie. Une fois connectés à un serveur informatique fournissant un service Usenet, les utilisateurs peuvent choisir les groupes mis à disposition par ce serveur auxquels ils désirent « s'abonner ». Pour chaque groupe auquel il est abonné, l'utilisateur peut alors voir tous les nouveaux articles mis à disposition sur ce groupe et tous les articles reçus par le serveur depuis un certain temps. Les anciens articles sont automatiquement effacés du serveur ; selon les serveurs, ce délai peut varier entre un mois et quelques jours. Toutefois Google Groups archive les articles de certains groupes de discussion. Lorsqu'un utilisateur envoie un article sur un serveur Usenet, celui-ci le propage à tous les autres serveurs avec qui il a conclu des accords d'échange d'articles (feeding, littéralement, « alimentation »), et ainsi de suite. Chaque serveur conserve une copie de cet article, et peut ensuite le mettre à disposition des utilisateurs ayant accès à ce serveur. Les utilisateurs emploient généralement un logiciel client appelé lecteur de nouvelles (parfois aussi appelé client de news, en référence au modèle client-serveur) pour lire et composer des articles Usenet. La plupart des navigateurs Web permettent d'accéder à Usenet, mais ils sont réduits aux fonctions de base, manquant de bien des fonctions orientées spécifiquement vers la lecture d'articles Usenet.

Les débuts d'Usenet

Usenet a été créé en 1979 par un groupe d'étudiants de Caroline du Nord : Tom Truscott, Jim Ellis, Denis Rockwell et Steve Daniel, de Dake, et Steve Bellovin, de Chapel Hill. Il est donc né après le courriel (1972) et après TCP/IP (1973), mais avant le DNS (1983) et bien avant le World Wide Web (1989). Le nom Usenet était une abréviation de Unix User Network ; on le considère aujourd'hui comme un nom propre. Usenet, à l'origine indépendant, a rapidement été connecté à ARPAnet, le futur Internet. En pratique, aujourd'hui, la totalité du trafic Usenet passe par Internet. Mais certains utilisateurs se plaisent à rappeler que « Usenet n'est pas Internet » et pourrait exister sans. En 1986, le protocole UUCP, utilisé à l'origine pour le transport des news, a été remplacé par NNTP, conçu spécialement. Dans les deux ans qui ont suivi, le Great Renaming, réorganisation des groupes pour faire face à la croissance et à l'internationalisation du réseau, a donné à Usenet sa structure d'ensemble actuelle.

Organisation

Depuis cette époque, les groupes sont rangés selon divers critères dans une arborescence. Le nom d'un groupe est formé de plusieurs composantes, séparées par des points ; et chaque composante correspond à un niveau d'arborescence. Il se lit de gauche à droite : par exemple, fr.education.superieur est un groupe francophone, consacré à l'éducation, et plus particulièrement à l'enseignement supérieur. L'ensemble des groupes situés dans une même branche de l'arborescence, c'est-à-dire qui ont des premières composantes identiques, s'appelle une hiérarchie. On utilise souvent le symbole
- pour désigner des caractères quelconques : ainsi, on écrit comp.
-
pour désigner l'ensemble des groupes de la hiérarchie comp. Chaque serveur peut choisir de diffuser ou non pour ses utilisateurs, et de propager ou non à ses voisins, le contenu de chaque groupe. Le plus souvent, l'administrateur ne choisit pas les groupes un par un, mais sélectionne des hiérarchies entières. Le cœur d'Usenet est le Big Eight ou Big8, formé des huit principales hiérarchies internationales : comp (ordinateurs), misc (divers), news (fonctionnement des newsgroups), rec (loisirs), sci (sciences), soc (société) et talk (débats), créées lors du Great Renaming, et humanities (lettres, sciences humaines), ajoutée par la suite. Le Big8, à l'exception parfois de la hiérarchie talk, est largement propagé. On y discute principalement mais pas uniquement en anglais. Il existe deux autres hiérarchies internationales importantes, où les règles — assez strictes — de fonctionnement du Big8 sont assouplies. Sur biz.
-
, la publicité est autorisée. Sur alt.
-
, n'importe qui peut créer un groupe, et sur alt.binaries.
-
il est permis de poster des pièces jointes. Il y a ensuite un certain nombre de hiérarchies « nationales » Certaines, comme la principale hiérarchie francophone Usenet-fr, correspondent en réalité à une langue et non pas à un pays. Les plus importantes sont presque aussi bien propagées que le Big8. Enfin, on trouve un grand nombre de hiérarchies mineures, à la propagation assez aléatoire. Il peut s'agir de réseaux de discussion complets et indépendants, d'espaces de discussion mis en place par des entreprises... De nombreux serveurs offrent une hiérarchie locale « privée » qui est parfois propagée à l'extérieur.

Fonctionnement technique

Articles

Pour lire les news, l'utilisateur utilise un logiciel spécialisé, le lecteur de nouvelles ou newsreader. Celui-ci se connecte à un serveur de nouvelles. Le dialogue avec le serveur utilise le protocole NNTP, décrit dans la RFC 977, et se déroule en général sur le port 119. Une fois connecté, le logiciel peut récupérer la liste des groupes disponibles, la liste des articles d'un groupe (en fait, leurs en-têtes), ou le contenu d'un article donné. Il peut aussi poster des articles, en les envoyant au serveur. Le format des articles, décrit dans la RFC 1036, ressemble beaucoup à celui des courriers électroniques. Un article commence par des en-têtes de la forme Champ: valeur Il y a un grand nombre d'en-têtes standardisés, pour indiquer l'expéditeur, la date, le sujet, les groupes où publier l'article... Les lecteurs de news les remplissent automatiquement. Il est possible d'ajouter ses propres en-têtes ; le nom du champ doit alors commencer par X-, par exemple X-No-Archive. Suivent une ligne vierge puis le corps de l'article proprement dit. Le tout doit être en texte brut. Le seul codage du texte brut lisible sur tout Usenet est ASCII. Selon les groupes, il est possible, en l'indiquant dans les en-têtes, d'envoyer des messages codés ISO-8859 sur 8 bits, et en particulier dans les jeux de caractères adaptés aux langues d'Europe de l'Ouest : ISO-8859-1 (latin1) et ISO-8859-15 (latin9). Enfin, dans quelques rares groupes, on peut utiliser Unicode, en général codé en UTF-8. Chaque article porte un identifiant unique, le Message-Id. C'est la façon principale d'y faire référence. Il faut noter à ce sujet qu'un article n'appartient pas à un groupe particulier. Il est simplement posté sur le réseau, et visible dans les groupes où il est posté d'après ses en-têtes. Cela permet de poster un même article dans plusieurs groupes en ne le transportant qu'un seul exemplaire. (Il est bien vu de ne pas abuser de ce procédé, appelé crosspost.) Le serveur doit ensuite propager l'article.

Serveurs et propagation

Les premières versions de Usenet utilisaient les logiciels B-News, puis C-News comme logiciels serveurs. Dans les Années 1990, INN fut développé pour tirer avantage de l'architecture d'Internet, qui favorisait un fonctionnement autre que la méthode stocker-faire suivre d'UUCP. Le développement d'INN continue à ce jour, et d'autres serveurs Usenet sont également apparus entre-temps. Pour mettre en place un serveur de news, il faut tout d'abord se procurer un feed, c'est-à-dire une connexion à un autre serveur (suffisamment important) qui pourra transmettre au nouveau serveur le trafic du reste d'Usenet. Les serveurs voisins se contactent régulièrement pour propager les articles. Schématiquement, ils comparent leurs listes d'articles, et chacun envoie à l'autre ce qu'il est le seul à avoir. Naturellement, les serveurs de news ne conservent et ne propagent que les articles suffisamment récents. Pour ce qui est des changements dans la structure des groupes elle-même, des articles spéciaux, appelés messages de contrôle, indiquent à chaque serveur les modifications de l'arborescence. Libre à chaque administrateur d'ignorer certains groupes. N'importe qui peut envoyer un message de contrôle, mais les serveurs sont configurés pour n'accepter, pour telle hiérarchie, que les messages signés par telle clé privée de cryptographie asymétrique. Les messages de contrôle « pirates » sont donc ignorés — à moins que l'administrateur du serveur n'en décide autrement.

Adresses et accès aux ressources

Reste un dernier point, celui de l'identification d'un serveur, d'un groupe ou d'un message. Comme à peu près tout ce qui est accessible par Internet, ces ressources peuvent être désignées par des « adresses » textuelles, les Universal Resource Identifiers ou URI. Les adresses concernant Usenet ne sont pas complètement standardisées. La RFC 1738 en définit trois sortes, mais on en trouve d'autres encore (voir la RFC 2396 et les Internet Draft draft-gilmain-news-url-02 et draft-stockwell-hnews-url-00). La syntaxe news: (par exemple news:fr.sci.maths), permet d'accéder à un groupe donné. Les logiciels qui l'utilisent demandent à l'utilisateur d'indiquer par ailleurs sur quel serveur le rechercher. Le nom de groupe spécial
-
correspond à la liste des groupes disponibles. Sur le même principe, news: désigne un article précis, toujours sur un serveur quelconque. Il n'y a pas d'ambiguïté car un Message-Id contient toujours le caractère @ ; un nom de groupe jamais. Enfin, nntp://:// identifie un article précis, dans un groupe précis, sur un serveur donné. On peut omettre les dernières composantes pour désigner un groupe ou un serveur, et le port par défaut est 119. Notons que certains sites web permettent de lire les forums usenet largement distribués et d'y poster ; ces sites offrent en général également une fonction d'archive (voir ci-après).

Archive des discussions

L'ensemble des articles postés sur Usenet n'a pas toujours été archivé. Cependant, de 1995 à 2001, la société Deja.com (devenue DejaNews.com en 1997) effectua un tel travail d'archivage et mit à la disposition des internautes une plateforme de recherche puis d'envoi d'articles. En décembre 2001, le moteur de recherche Google, en rachetant DejaNews.com et sa base d'articles, ajouta à son site une archive d'articles Usenet explorable, remontant jusqu'aux tous débuts de celui-ci. Ces archives sont incomplètes, mais néanmoins très fournies. Il est également possible de lire et de poster des articles à partir du site de Google.

Transport de fichiers binaires

Usenet a été développé pour distribuer du texte brut utilisant le jeu de caractères 7 bits ASCII. À l'aide de programmes qui codent des données sur 8 bits comme des suites de caractères ASCII, il est possible de transférer par Usenet des fichiers binaires quelconques. En raison de leur taille et de leur légalité parfois douteuse, les articles contenant des fichiers binaires ne sont acceptés que sur des groupes spécifiques, ce qui permet aux administrateurs de serveurs d'accepter ou refuser facilement de les distribuer. La plus ancienne de ces méthodes de codage est uuencode, initialement développée pour UUCP. À la fin des années 1980, beaucoup de serveurs limitaient la longueur des articles à 60 000 caractères ; et de telles limites existent toujours, même si elles sont généralement plus élevées. Pour cette raison, les données d'un fichier sont réparties en différents articles et doivent être réassemblées par le lecteur de nouvelles. Avec les extensions du format des articles (Base64, « Quoted-Printable », MIME) sont apparues de nouvelles possibilités pour le transport de contenus binaires. En pratique, MIME est de plus en plus utilisé dans les messages, mais guère pour transmettre des pièces jointes binaires. Par ailleurs, certains systèmes d'exploitation qui associent aux fichiers des informations auxiliaires (métadonnées) nécessitent des formats spéciaux. Mac OS utilise par exemple Binhex et des types MIME spécifiques. Pour mieux utiliser les capacités du réseau Usenet et augmenter la vitesse de transfert, la procédure de codage yEnc a été mise au point en 2001. Elle utilise moins d'espace que les codages usuels en supposant que la plupart des caractères 8 bits peuvent être transmis correctement.

Voir aussi

Articles connexes


- Loi de Godwin
- RFC 1036
- RFC 977
- Forums électroniques
- Forums Internet
- FAQ (Foire Aux Questions)
- Flaming (Engueulade)
- Kill file (Filtre)
- Le « Great Renaming »
- Serdar Argic
- Spam (Pourriel)
- la Grande Cabale (Backbone Cabal)
- « There Is No Cabal »
- Cabale Usenet
- Usenet et la censure
- Filtrage de Usenet

Documents externes


- [http://www.usenet-fr.net Les principaux documents sur Usenet, en français]
- [http://www.usenet-fr.net/liste-groupes.html Liste des groupes fr.
- ]
- [http://www.centrale-lyon.org/ng/ngsynth.php Statistiques de la modération des forums fr.
- ]
- [http://www.usenetbinaries.com/ Usenet Binaries]
- [http://groups.google.com Google groups] (archive Usenet)
- [http://www.usenetgratuit.com/ Accès gratuit aux usenets]
- [http://www.usenet-replayer.com Usenet Replayer] (archives de fichiers binaires; accessible librement)
- [http://www.ucache.com/ UCACHE]
- [http://www.iprelax.fr/nntp/ Page sur la programmation en rapport avec le protocole NNTP]
- [http://www.nntpfr.willemijns.com Liens et FAQ sur les serveurs de news publics et gratuits]
- http://www.alea.net/usenet/ Catégorie:Usenet Catégorie:Internet Catégorie:Forum ja:ネットニュース ko:유즈넷 simple:Usenet

Telnet

Telnet est un protocole réseau utilisé sur tout réseau supportant le protocoleTCP/IP. Il appartient à la couche session du modèle OSI et à la couche application du modèle ARPA Il est normalisé par l'IETF (RFC 854 et RFC 855). Selon, l'IETF, le but du protocole Telnet est de fournir un moyen de communication très généraliste, bi-directionnel et orienté octet. telnet est aussi une commande permettant de créer une session Telnet sur une machine distante. Cette commande était disponible d'abord sur les sytèmes Unix puis elle apparu sur la plupart des systèmes d'exploitation.

Détails du protocole

Telnet est un protocole de type client-serveur basé sur TCP. Les clients se connectent généralement sur le port 23 du serveur.

Utilisation

Une des utilisations majeures de la commande telnet était de se connecter à des serveurs telnet, qui demandaient un identifiant, puis un mot de passe, et donnaient une ligne de commmande sur la machine distante en échange. Pour cela elle nécessitait le lancement d'un démon sur la machine hôte, souvent appelé telnetd. La commande telnet reste malgré tout une commande très pratique pour tester des serveurs. Vu la flexibilité du programme, il est possible d'utiliser la commande telnet pour établir une connexion TCP interactive avec d'autres services tel que SMTP ou HTTP.

Défaut de sécurité

Le côté basique de telnet fait que toute comunication est transmise en clair sur le réseau, mots de passes compris. Des sniffer comme tcpdump ou ethereal permettent d'intercepter les communications de la commande telnet. Il est préférable d'utiliser des protocoles cryptés (comme SSH) pour obtenir des accès en ligne de commande sur des machines distantes, à la place de Telnet.

Voir aussi


- SSH

Liens externes


- [http://www.chiark.greenend.org.uk/~sgtatham/putty putty] : un client telnet, SSH et rlogin
- [http://telnetd.sourceforge.net/ telnetd] : un démon telnet écrit en Java Catégorie:Internet ja:Telnet

Uniform Resource Name

Uniform Resource Name, traduit littéralement de l'anglais par « nom uniforme de ressource », est le nom d'un standard informatique dans le domaine de l'Internet qui concerne principalement le World Wide Web. Le document de base est le RFC 2141 URN Syntax publié en 1997 par l'Internet Engineering Task Force. Il donne une syntaxe de chaîne de caractères utilisable pour identifier une ressource (un document, une image, un enregistrement sonore, etc.) globalement, durant toute son existence, indépendamment de sa localisation ou de son accessibilité par Internet. Les Uniform Resource Names sont des Uniform Resource Identifiers dont la méthode est urn. Le sigle URN est généralement utilisé, en français comme en anglais, pour désigner une telle chaîne de caractères. Par exemple urn:ietf:rfc:2141 est un URN identifiant le RFC 2141.

Forme

Les URN sont des Uniform Resource Identifiers (URI) et en respectent donc les règles syntaxiques. Les URN ont la syntaxe suivante : urn:NID:NSS
- urn est la méthode d'URI des URN.
- NID (Namespace Identifier) est un identificateur d'espace de nommage.
- NSS (Namespace specific String) est la partie spécifique à l'espace de nommage identifié par le NID. L'interprétation syntaxique de cette partie dépend de l'espace de nommage. L'usage de minuscules ou de majuscules ne fait pas de différence pour l'écriture de la méthode urn ni pour le NID. Il peut en revanche faire une différence pour le NSS.

Espace de nommage

Le NID définit un espace de nommage. L'Internet Assigned Numbers Authority (IANA) tient un registre des NID officiellement enregistrés. Le RFC 3406 donne la marche à suivre pour procéder à un tel enregistrement.

Exemples


- urn:ietf:rfc:2141 (réf. RFC 2648)
- urn:ietf:std:50 (réf. RFC 2648)
- URN:ISBN:0-395-36341-1 (réf. RFC 3187)
- urn:liberty:schemas:authctx:2002:05 (réf. RFC 3622)

URN et URL

Lors de la conception du World Wide Web, les Uniform Resource Locators (URL) ont été inventées et utilisées pour l'identification des ressources. Mais une URL identifie en fait l'emplacement d'une ressource, plutôt que la ressource elle-même. Ainsi, lorsqu'une ressource est déplacée, par exemple mise sur un autre serveur Web, toutes les URL l'identifiant sont rendues obsolètes. Ce problème est à la base de la plupart des hyperliens « cassés » du Web. Pour remédier à ce problème, le concept d'URN a été avancé. Par opposition aux URL, les URN identifient les ressources elles-mêmes, indépendamment de leur emplacement. Ce concept nécessite toutefois un mécanisme capable de trouver l'emplacement d'une ressource – par exemple son URL, du moins si elle est accessible sur le réseau – à partir de son URN. Un tel mécanisme repose typiquement sur un répertoire de correspondances. Dans la pratique, les URN ne sont guère utilisés. Les problèmes de localisation de ressource sont généralement résolus avec un moteur de recherche. On peut noter la fonctionnalité de « document en cache » qui conserve un certain temps une version du document référencé, indépendamment de son accessibilité à son URL originale.

Voir aussi

Liens internes

[ URI | URL | RFC | IETF | IANA | World Wide Web ]

Liens externes


- [http://www.ietf.org/html.charters/urn-charter.html Uniform Resource Names Charter], ancien groupe de travail de l'IETF sur les URN ;
- [http://www.iana.org/assignments/urn-namespaces Official IANA Registry of URN Namespaces] ;
- RFC 1630, Universal Resource Identifiers in WWW, juin 1994 (obsolète), présente les URI, URL et URN ;
- RFC 1737, Functional Requirements for Uniform Resource Names, décembre 1994 ;
- RFC 2141, URN Syntax, mai 1997, décrit la syntaxe des URN ;
- RFC 2168, Resolution of Uniform Resource Identifiers using the Domain Name System, juin 1997 (obsolète) ;
- RFC 2169, A Trivial Convention for using HTTP in URN Resolution, juin 1997 ;
- RFC 2276, Architectural Principles of Uniform Resource Name Resolution, janvier 1998 ;
- RFC 2288, Using Existing Bibliographic Identifiers as Uniform Resource Names, février 1998 ;
- RFC 2396, Uniform Resource Identifiers (URI): Generic Syntax, août 1998, syntaxe générale des URI ;
- RFC 2483, URI Resolution Services Necessary for URN Resolution, janvier 1999 ;
- RFC 2611, URN Namespace Definition Mechanisms, juin 1999 (obsolète) ;
- RFC 2648, A URN Namespace for IETF Documents, août 1999 ;
- RFC 2915, The Naming Authority Pointer (NAPTR) DNS Resource Record, septembre 2000 (obsolète) ;
- RFC 3043, The Network Solutions Personal Internet Name (PIN): A URN Namespace for People and Organizations, janvier 2001 ;
- RFC 3044, Using The ISSN (International Serial Standard Number) as URN (Uniform Resource Names) within an ISSN-URN Namespace, janvier 2001 ;
- RFC 3061, A URN Namespace of Object Identifiers, février 2001 ;
- RFC 3085, URN Namespace for NewsML Resources, mars 2001 ;
- RFC 3120, A URN Namespace for XML.org, juin 2001 ;
- RFC 3121, A URN Namespace for OASIS, juin 2001 ;
- RFC 3151, A URN Namespace for Public Identifiers, août 2001 ;
- RFC 3187, Using International Standard Book Numbers as Uniform Resource Names, octobre 2001 ;
- RFC 3188, Using National Bibliography Numbers as Uniform Resource Names, octobre 2001 ;
- RFC 3401, Dynamic Delegation Discovery System (DDDS) Part One: The Comprehensive DDDS, octobre 2002 ;
- RFC 3402, Dynamic Delegation Discovery System (DDDS) Part Two: The Algorithm, octobre 2002 ;
- RFC 3403, Dynamic Delegation Discovery System (DDDS) Part Three: The Domain Name System (DNS) Database, octobre 2002 ;
- RFC 3404, Dynamic Delegation Discovery System (DDDS) Part Four: The Uniform Resource Identifiers (URI), octobre 2002 ;
- RFC 3405, Dynamic Delegation Discovery System (DDDS) Part Five: URI.ARPA Assignment Procedures, octobre 2002 ;
- RFC 3406, Uniform Resource Names (URN) Namespace Definition Mechanisms, octobre 2002 ;
- RFC 3541, A Uniform Resource Name (URN) Namespace for the Web3D Consortium (Web3D), mai 2003 ;
- RFC 3613, Definition of a Uniform Resource Name (URN) Namespace for the Middleware Architecture Committee for Education (MACE), octobre 2003 ;
- RFC 3614, A Uniform Resource Name (URN) Namespace for the Motion Picture Experts Group (MPEG), septembre 2003 ;
- RFC 3615, A Uniform Resource Name (URN) Namespace for SWIFT Financial Messaging, septembre 2003 ;
- RFC 3616, A Uniform Resource Name (URN) Namespace for Foundation for Intelligent Physical Agents (FIPA), septembre 2003 ;
- RFC 3622, A Uniform Resource Name (URN) Namespace for the Liberty Alliance Project, février 2004 ;
- RFC 3937, A Uniform Resource Name (URN) Namespace for the International Press Telecommunications Council (IPTC), octobre 2004. Catégorie:World Wide Web

World Wide Web

] Le World Wide Web, communément appelé le Web, parfois la Toile, littéralement la « toile (d'araignée) mondiale », est un système hypertexte public fonctionnant sur Internet et qui permet de consulter, avec un navigateur Web, des pages Web mises en ligne dans des sites Web. L'image de la toile vient des hyperliens qui lient les pages Web entre elles. Le Web a rendu les médias grand public attentifs à Internet. Depuis, il est fréquemment confondu avec ce dernier, particulièrement lorsque le mot Toile est utilisé. Ce n'est cependant qu'un des systèmes disponibles sur Internet, avec le courrier électronique, Usenet, la messagerie instantanée, etc. Le Web a été inventé alors qu'Internet existait depuis plusieurs années.

Terminologie

World Wide Web

Le World Wide Web est et a été désigné par de nombreux noms et abréviations synonymes : WorldWideWeb, World Wide Web, World-wide Web, Web, WWW, W3, Toile d'araignée mondiale, Toile mondiale, Toile. Le nom du projet originel était WorldWideWeb (voir historique). Le mots ont été rapidement séparés en World Wide Web pour améliorer la lisibilité. Le nom World-Wide Web a également été utilisé par les inventeurs du Web, mais le nom désormais préconisé par le World Wide Web Consortium sépare les trois mots sans trait d'union [http://www.w3.org/People/Berners-Lee/FAQ.html#Spelling]. Bien que « mondial » s'écrit world-wide ou worldwide en anglais, l'orthographe World Wide Web et l'abréviation Web sont maintenant bien établis. En inventant le Web, Tim Berners-Lee avait aussi pensé à d'autres noms, comme Information Mesh (maillage d'informations), Mine of Information ou encore The Information Mine (la mine d'informations, dont le sigle serait Tim). Le sigle WWW a été largement utilisé pour abréger World Wide Web avant que l'abréviation Web ne prenne le pas. La prononciation laborieuse en français comme en anglais de WWW a sans doute précipité son déclin. Les lettres www restent cependant très utilisées dans les adresses Web et quelques autres usages formels ou techniques, bien que cela ne réponde à aucune contrainte technique. Dans la seconde moitié des années 1990, alors que les réseaux étaient engorgés par la popularité grandissante du Web, une blague répandue prétendait que WWW signifiait World Wide Wait, soit « attente mondiale ». WWW est parfois abrégé en W3, abréviation qu'on retrouve dans le sigle W3C du World Wide Web Consortium. Pour écrire « le Web », l'usage de la minuscule (« le web ») est de plus en plus courant. L'Office québécois de la langue française préconise la majuscule [http://www.olf.gouv.qc.ca/ressources/bibliotheque/dictionnaires/Internet/fiches/2075076.html], le Journal officiel français préconise « la toile d'araignée mondiale » [http://www.culture.gouv.fr/culture/dglf/cogeter/16-03-99-internet-listes.html].

Termes rattachés

La terminologie propre au Web contient plusieurs dizaines de termes. Ce chapitre expose ceux qui sont utilisés dans cet article. L'expression en ligne signifie « connecté à un réseau », en l'occurrence le réseau informatique Internet. Cette expression n'est pas propre au Web, on l'a retrouve à propos du téléphone. Un hôte est un ordinateur en ligne. Chaque hôte d'Internet est identifié par une adresse IP à laquelle correspondent zéro, un ou plusieurs noms d'hôte. Cette terminologie n'est pas propre au Web, mais à Internet. Une ressource du Web est une entité informatique (texte, image, forum Usenet, boîte aux lettres électronique, etc.) accessible indépendamment d'autres ressources. Une ressource en accès public est librement accessible depuis Internet. Une ressource locale est présente sur l'ordinateur utilisé, par opposition à une ressource distante (ou en ligne), accessible à travers un réseau. On ne peut accéder à une ressource distante qu'en respectant un protocole de communication. Les fonctionnalités de chaque protocole varient : réception, envoi, voire échange continu d'informations. HTTP (pour HyperText Transfer Protocol) est le protocole de communication communément utilisé pour transférer les ressources du Web. HTTPS est la variante sécurisée de ce protocole. Une URL (pour Uniform Resource Locator) pointe sur une ressource. C'est une chaîne de caractères permettant d'indiquer un protocole de communication et un emplacement pour toute ressource. Un hyperlien (ou lien) est un élément dans une ressource associé à une URL. Un hyperlien est à sens unique, la ressource pointée n'en porte aucune trace. Il existe deux types d'hyperlien : le premier doit être activé pour accéder à la ressource pointée ; le second cause un accès automatique à la ressource pointée. HTML (pour HyperText Markup Language) est un langage informatique permettant de décrire le contenu d'un document (titres, paragraphes, disposition des images, etc.) et d'y inclure des hyperliens. Un document HTML est un document décrit avec le langage HTML. Dans un mode de communication client-serveur, un serveur est un hôte sur lequel fonctionne un logiciel serveur auquel peuvent se connecter des logiciels clients fonctionnant sur des hôtes clients. Un serveur Web est un hôte sur lequel fonctionne un serveur HTTP (ou serveur Web). Un serveur Web héberge les ressources qu'il sert. Un navigateur Web est un logiciel client HTTP conçu pour accéder aux ressources du Web. Sa fonction de base est de permettre la consultation des documents HTML disponibles sur les serveurs HTTP. Le support d'autres types de ressource et d'autres protocoles de communication dépend du navigateur considéré. Une page Web (ou page) est un document destiné à être consulté avec un navigateur Web. Une page Web est toujours constituée d'une ressource centrale (généralement un document HTML) et d'éventuelles ressources liées automatiquement accédées (typiquement des images). Un éditeur HTML (ou éditeur Web) est un logiciel conçu pour faciliter l'écriture de documents HTML et de pages Web en général. Un site Web (ou site) est un ensemble de pages Web et d'éventuelles autres ressources, liées dans une structure cohérente, publiée par un propriétaire (une entreprise, une administration, une association, un particulier, etc.) et hébergée sur un ou plusieurs serveurs Web. Visiter un site Web signifie « consulter ses pages ». Le terme visite vient du fait que l'on consulte généralement plusieurs pages d'un site, comme on visite les pièces d'un bâtiment. La visite est menée par un utilisateur (ou visiteur ou internaute). La mesure d'audience est obtenue en copiant le code en javascript d’un lien vers le site d'un prestataire spécialisé suivant la technique du marqueur à distance. Une adresse Web est une URL de page Web, généralement écrite sous une forme simplifiée limitée à un nom d'hôte. Une adresse de site Web est en fait l'adresse d'une page du site prévue pour accueillir les visiteurs. Un hébergeur Web est une entreprise de services informatiques hébergeant (mettant en ligne) sur ses serveurs Web les ressources constituant les sites Web de ses clients. Une agence Web est une entreprise de services informatiques réalisant des sites Web pour ses clients. L'expression surfer sur le Web signifie « consulter le Web ». Elle a été inventée pour mettre l'accent sur le fait que consulter le Web consiste à suivre de nombreux hyperliens de page en page. Elle est principalement utilisée par les médias ; elle n'appartient pas au vocabulaire technique. Un annuaire Web est un site Web répertoriant des sites Web. Un portail Web est un site Web tentant de regrouper la plus large palette d'informations et de services sur un thème donné. Un service Web est une technologie client-serveur basée sur les protocoles du Web.

Architecture

Le World Wide Web, en tant qu'ensemble de ressources hypertextes, est modélisable en graphe orienté avec les ressources pour sommets et les hyperliens pour arêtes. Du fait que le graphe est orienté, certaines ressources peuvent constituer des puits : il n'existe aucun chemin vers le reste du Web. À l'inverse, certaines ressources peuvent constituer des sources : il n'existe aucun chemin depuis le reste du Web. Techniquement, rien ne distingue le World Wide Web d'un quelconque autre web utilisant les mêmes technologies ; d'ailleurs d'innombrables autres webs séparés du Web existent. Dans la pratique, on considère qu'une page d'un site Web populaire, comme un annuaire Web, fait partie du Web. Le Web se trouve alors défini par les ressources et les hyperliens que l'on peut récursivement découvrir à partir de cette page, ce qui exclut les sources et les webs séparés.

Intranets et webs privés

Un web sur un intranet est soit séparé du Web, soit une source du Web. Il est une source lorsque l'intranet est relié à Internet et qu'un hyperlien du web pointe sur une ressource du Web. Les liens depuis le Web sont en revanche impossibles car par définition un intranet n'offre pas d'accès public. Une source peut aussi se trouver sur Internet. En ce cas, elle constitue un web virtuellement privé, car le public n'a aucun moyen de le découvrir, même si l'accès est public.

Limites pratiques

L'exploration récursive à partir de ressources bien choisies est la méthode de base des robots d'indexation des moteurs de recherche. Dans la pratique, plusieurs catégories de ressources découvertes sont souvent ignorées :
- les ressources sans accès public, notamment les pages personnelles, administratives ou payantes, protégées par un mot de passe ;
- les ressources appartenant à des systèmes distincts et souvent plus anciens que le Web (courrier électronique, Usenet, sites FTP), voire simplement les ressources non servies par un serveur HTTP ou HTTPS ;
- les ressources de type non supporté ;
- les ressources vers lesquels les hyperliens sont créés dynamiquement en réponse aux interrogations des visiteurs ;
- les ressources marquées comme ne devant pas être indexées par les robots d'indexation. En 2004, les moteurs de recherche indexent environ 4 milliards de ressources. Avec des millions de pages et documents créés, mais aussi modifiés et supprimés, plusieurs projets d'archivages du contenu du Web ont vu le jour, afin de conserver une trace. Le projet Internet Archive est l'un d'eux.

Web profond

Le « Web profond » ou « Web invisible » est l'ensemble des pages et documents, qui sont accessibles par les internautes, mais non trouvables au travers de