URL

Од Википедија, бесплатната енциклопедија
Одете на навигација Одете на пребарување

Униформен локатор на ресурси (од инж. Униформа локатор на ресурси, кратки URL-то [. ˌ ј у ː ɑ ː r на e l ]) - систем на унифициран е-ресурси, или локација Единствен одредница ( датотека ) [1] .

Се користи како стандард за снимање врски до објекти на Интернет (линкови за хипертекст на „World Wide Web“ www ).

Кратенката "URL" се користи за означување на е-пошта во согласност со ГОСТ Р 7.0.5-2008.

Историја

URL беше измислен од Тим Бернерс-Ли во 1990 година во theидовите на Европскиот совет за нуклеарни истражувања ( fr. The Conseil Européen pour la Recherche Nucléaire, CERN ) во енева ,Швајцарија . URL -то стана фундаментална иновација на Интернет. Првично, URL -то требаше да ја означи локацијата на ресурсите (најчесто датотеки) на World Wide Web . Денес, URL -адресите се користат за да се однесуваат на адресите на скоро сите ресурси на Интернет. Стандардот за URL е вграден во RFC 3986 . Во денешно време, URL -адресите се продаваат како дел од поопшт систем за идентификација на ресурси на URI , самиот термин URL постепено му отстапува место на поширокиот термин URI . Стандардот за URL е регулиран од IETF и неговите филијали.

Во 2009 година, Тим Бернерс-Ли сугерираше дека двојниот пресек // на почетокот на URL-то е вишок по наведување мрежен протокол [2] [3] .

URL структура

URL -то е дизајнирано како систем за што поприродно укажување на локацијата на ресурсите на веб -страницата. Локаторот требаше да биде лесно проширлив и да користи само ограничен сет на ASCII знаци (на пример, URL -адресата никогаш не користи празно место ). Во овој поглед, се појави следната традиционална форма на означување на URL -то:

<схема>:[//[<логин>[:<пароль>]@]<хост>[:<порт>]][/<URL‐путь>][?<параметры>][#<якорь>]

Во овој запис:

шема
шема за пристап до ресурсот; во повеќето случаи мислиме на мрежниот протокол
Логирај Се
корисничкото име што се користи за пристап до ресурсот
лозинка
лозинка на наведениот корисник
домаќин
целосно квалификувано име на домен на домаќинот во системот DNS или IP адресата на домаќинот во форма на четири групи децимални броеви одделени со точки; броевите се цели броеви во опсег од 0 до 255.
пристаниште
пристаниште за домаќин за поврзување
Url патека
појаснување информации за локацијата на ресурсот; зависи од протоколот.
опции
низа за пребарување со параметри пренесени на серверот ( користејќи го методот GET ). Започнува со лик ? , параметар сепаратор - знак & . Пример ?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3
сидро
идентификатор на сидро (англиски) претходи # . Сидрото може да биде наслов во документот или атрибут id (англиски) елемент. Користејќи таква врска, прелистувачот ќе ја отвори страницата и ќе го премести прозорецот до наведениот елемент. На пример, врска до овој дел од статијата: https://ru.wikipedia.org/wiki/URL#Структура_URL .

УРЛ -шеми (протоколи)

Вообичаено прифатените шеми за URL (протоколи) вклучуваат:

  • ftp - FTP протокол за пренос на датотеки
  • http - Протокол за пренос на хипертекст HTTP
  • rtmp е комерцијален протокол за пораки во реално време, главно се користи за пренос на видео и аудио од веб -камери преку Интернет.
  • rtsp е протокол за стриминг во реално време.
  • https е специјална имплементација на HTTP протоколот што користи енкрипција (обично SSL или TLS )
  • gopher - протокол Gopher
  • mailto - адреса за е -пошта
  • вести - вести на Усенет
  • nntp - Usenet вести преку NNTP
  • irc - IRC протокол
  • smb - протокол SMB / CIFS
  • prospero - Услуга за директориум на Просперо
  • телнет - врска до интерактивна Телнет сесија
  • wais - база на податоци за систем WAIS
  • xmpp - XMPP протокол (дел од Jabber )
  • датотека - името на локалната датотека
  • податоци - директни податоци ( Податоци: URL )
  • тел - повик до наведениот телефонски број

Шеми за егзотични URL:

УРЛ -шеми во прелистувачи:

Кодирање URL

Стандардот URL користи сет на знаци US- ASCII . Ова има сериозен недостаток, бидејќи се дозволени само латински букви, бројки и неколку интерпункциски знаци. Сите други знаци треба да се кодираат. На пример, кирилични букви, букви со дијакритика , лигатури , хиероглифи треба да се кодираат. Кодирањето за транскодирање е опишано во RFC 3986 и се нарекува URL-кодирање, URL-кодирано или проценти-кодирање .

Пример за кодирање може да се види наВикипедија на руски јазик, која го користи рускиот јазик во URL-то. На пример, линија како:

https://ru.wikipedia.org/wiki/Wikipedia

кодирани како:

 https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F

Имплементација

Конверзијата се одвива во две фази: прво, секој кириличен знак е кодиран во UTF-8 во низа од два бајта, а потоа секој бајт од оваа секвенца е напишан со хексадецимална нотација , пред која стои знак за проценти (%):

 B → D0 и 92 →% D0% 92
и → D0 и B8 →% D0% B8
k → D0 и BA →% D0% BA
и → D0 и B8 →% D0% B8, итн.
Резервирани знаци [5]
! * ' ( ) ; : @ & = + $ , / ? # [ ]
Не резервирани знаци [5]
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z
a b c d e f g h i j k l m n o p q r s t u v w x y z
0 1 2 3 4 5 6 7 8 9 - _ . ~

Сите други знаци во URI се кодирани.

Резервираните знаци се кодирани на следниов начин:

! " # [6] $ % & [6] ' * + , [6] : [6] ; [6] < = [6] >> ? [6] [ ] ^ ` { | } <просторот>
% 21 % 22 % 23 % 24 % 25 % 26 % 27 % 2А % 2B % 2С % 3А % 3Б % 3С % 3D % 3Е % 3F % 5Б % 5Д % 5Е % 60 % 7Б % 7С % 7Д % 20 [7]

Кодирањето на параметрите во Internet Explorer и стариот Firefox е нешто различно [8] .

Во некои случаи, URL -то е формирано со кодирање Base58 [9] .

Стандард на ИРИ

Бидејќи буквите од сите азбуки, освен основната латиница , претрпуваат таква трансформација, URL -то со зборовите на огромното мнозинство јазици може да стане нечитливо за некоја личност.

Сето ова е во спротивност со принципот на интернационализам , објавен од сите водечки организации на Интернет , вклучувајќи ги и W3C и ISOC . Овој проблем е повикан да одлучи за стандардот на ИРИ ( инж. Интернационализирани ресурси идентификатор) - Меѓународни идентификатори на ресурси, што не би било проблем да се користат знаци на Уникод, и кои затоа не ги повредуваат правата на другите јазици . Тешко е однапред да се каже дали ИРИ некогаш ќе ги заменат таквите широко користени URL -адреси (и URIs воопшто).

Ограничување на должината

Формално, должината на URL -то не е ограничена, но прелистувачите имаат ограничувања на должината на URL -то. Не се препорачува да се користат URL -адреси подолги од 2048 знаци, бидејќи Microsoft Internet Explorer го има ова ограничување [10] .

PURL иницијатива

Друга голема маана во URL -адресите е нејзината недостаток на флексибилност. Ресурсите на World Wide Web и Интернетот се поместуваат, но URL -линковите остануваат, укажувајќи на исчезнатите ресурси. Ова е особено болно за дигиталните библиотеки, каталози и енциклопедии. За да се реши овој проблем, беа понудени постојани локатори PURL ( Eng. Persistent Uniform the Resource Locator). Во суштина, ова се исти URL -адреси, но тие не укажуваат на одредена локација на ресурсот, туку на запис во базата на податоци PURL, каде што, пак, специфичната URL -адреса на ресурсот е веќе снимена. При пристап до PURL, серверот го наоѓа потребниот запис во оваа база на податоци и го пренасочува барањето до одредена локација на ресурсите. Ако адресата на ресурсот се промени, тогаш нема потреба да ги поправите сите безброј врски до него - само треба да го смените записот во базата на податоци. Во моментов, оваа идеја не е стандардизирана и не е широко прифатена.

исто така види

Забелешки (уреди)

  1. URL (Uniform Resource Locator) - Единствен локатор на ресурси. Адресата на информативниот ресурс (датотека) на Интернет - Збирка акроними од областа на компјутерската технологија и програмирање . 2006 година.
  2. ↑ На двојно коса црта во интернет адреси појави како резултат на Брзината на неговиот творец РИА Новости (2009-10-14 19:05). Преземено на 11 јули 2010 година. Архивирано на 25 август 2011 година.
  3. Креаторот на интернет жали за двојно коса црта 3DNews Daily Digital Digest.14 октомври 2009 година.
  4. На Chrome URL Датум на лекување: 9 декември 2014 година.
  5. 1 2 RFC 3986 Дел 2.2
  6. 1 2 3 4 5 6 7 Знакот е дозволен, но кога е наведен во обичен текст има посебно синтаксичко значење
  7. МедијаВики избегнува кодирање на празниот простор како% 20, наместо тоа, наместо тоа, се заменува со подзнак „_“. Многу пребарувачи го заменуваат просторот со симболот "+".
  8. HTTP, RFC 3986 и прелистувачи
  9. Flickr услуги
  10. Максималната должина на URL во Internet Explorer е 2083 знаци . microsoft.com.

Линкови