URL
Униформен локатор на ресурси (од инж. Униформа локатор на ресурси, кратки URL-то [. ˌ ј у ː ɑ ː r на e l ]) - систем на унифициран е-ресурси, или локација Единствен одредница ( датотека ) [1] .
Се користи како стандард за снимање врски до објекти на Интернет (линкови за хипертекст на „World Wide Web“ www ).
Кратенката "URL" се користи за означување на е-пошта во согласност со ГОСТ Р 7.0.5-2008.
Историја
URL беше измислен од Тим Бернерс-Ли во 1990 година во theидовите на Европскиот совет за нуклеарни истражувања ( fr. The Conseil Européen pour la Recherche Nucléaire, CERN ) во енева ,Швајцарија . URL -то стана фундаментална иновација на Интернет. Првично, URL -то требаше да ја означи локацијата на ресурсите (најчесто датотеки) на World Wide Web . Денес, URL -адресите се користат за да се однесуваат на адресите на скоро сите ресурси на Интернет. Стандардот за URL е вграден во RFC 3986 . Во денешно време, URL -адресите се продаваат како дел од поопшт систем за идентификација на ресурси на URI , самиот термин URL постепено му отстапува место на поширокиот термин URI . Стандардот за URL е регулиран од IETF и неговите филијали.
Во 2009 година, Тим Бернерс-Ли сугерираше дека двојниот пресек //
на почетокот на URL-то е вишок по наведување мрежен протокол [2] [3] .
URL структура
URL -то е дизајнирано како систем за што поприродно укажување на локацијата на ресурсите на веб -страницата. Локаторот требаше да биде лесно проширлив и да користи само ограничен сет на ASCII знаци (на пример, URL -адресата никогаш не користи празно место ). Во овој поглед, се појави следната традиционална форма на означување на URL -то:
<схема>:[//[<логин>[:<пароль>]@]<хост>[:<порт>]][/<URL‐путь>][?<параметры>][#<якорь>]
Во овој запис:
- шема
- шема за пристап до ресурсот; во повеќето случаи мислиме на мрежниот протокол
- Логирај Се
- корисничкото име што се користи за пристап до ресурсот
- лозинка
- лозинка на наведениот корисник
- домаќин
- целосно квалификувано име на домен на домаќинот во системот DNS или IP адресата на домаќинот во форма на четири групи децимални броеви одделени со точки; броевите се цели броеви во опсег од 0 до 255.
- пристаниште
- пристаниште за домаќин за поврзување
- Url патека
- појаснување информации за локацијата на ресурсот; зависи од протоколот.
- опции
- низа за пребарување со параметри пренесени на серверот ( користејќи го методот GET ). Започнува со лик
?
, параметар сепаратор - знак&
. Пример?параметр_1=значение_1&параметр_2=значение_2&параметр3=значение_3
- сидро
- идентификатор на сидро претходи
#
. Сидрото може да биде наслов во документот или атрибут id елемент. Користејќи таква врска, прелистувачот ќе ја отвори страницата и ќе го премести прозорецот до наведениот елемент. На пример, врска до овој дел од статијата:https://ru.wikipedia.org/wiki/URL#Структура_URL
.
УРЛ -шеми (протоколи)
Овој дел нема линкови до извори на информации . |
Вообичаено прифатените шеми за URL (протоколи) вклучуваат:
- ftp - FTP протокол за пренос на датотеки
- http - Протокол за пренос на хипертекст HTTP
- rtmp е комерцијален протокол за пораки во реално време, главно се користи за пренос на видео и аудио од веб -камери преку Интернет.
- rtsp е протокол за стриминг во реално време.
- https е специјална имплементација на HTTP протоколот што користи енкрипција (обично SSL или TLS )
- gopher - протокол Gopher
- mailto - адреса за е -пошта
- вести - вести на Усенет
- nntp - Usenet вести преку NNTP
- irc - IRC протокол
- smb - протокол SMB / CIFS
- prospero - Услуга за директориум на Просперо
- телнет - врска до интерактивна Телнет сесија
- wais - база на податоци за систем WAIS
- xmpp - XMPP протокол (дел од Jabber )
- датотека - името на локалната датотека
- податоци - директни податоци ( Податоци: URL )
- тел - повик до наведениот телефонски број
Шеми за егзотични URL:
- afs - глобалното име на датотека во системот за датотеки Ендрју
- cid - идентификатор на содржина за MIME делови
- ИД на средна порака за е -пошта
- сервер за пошта - пристап до податоци од сервери за пошта
- nfs е името на датотеката на датотечниот систем NFS
- tn3270 - имитирајте интерактивна Телнет 3270 сесија
- z39.50 - Пристап до услугите ANSI Z39.50
- skype - протокол на Skype
- smsto - отворете го уредувачот на СМС во некои мобилни телефони
- ed2k - P2P мрежа за споделување датотеки на eDonkey
- пазар - Андроид пазар
- пареа - протокол за пареа
- биткоин - Bitcoin криптовалута
- ob - OpenBazaar
- tg - Телеграма
УРЛ -шеми во прелистувачи:
- преглед -извор - прегледајте го изворниот код на наведената веб -страница во различни прелистувачи.
- Различни прелистувачи користат различни клучни зборови за пристап до страници за услуги и услуги:
- хром во прелистувачот Google Chrome и други прелистувачи на моторот Chromium [4] ;
- за Firefox и други прелистувачи Gecko ;
- опера во опера ;
- прелистувач во прелистувачот Yandex .
Кодирање URL
Стандардот URL користи сет на знаци US- ASCII . Ова има сериозен недостаток, бидејќи се дозволени само латински букви, бројки и неколку интерпункциски знаци. Сите други знаци треба да се кодираат. На пример, кирилични букви, букви со дијакритика , лигатури , хиероглифи треба да се кодираат. Кодирањето за транскодирање е опишано во RFC 3986 и се нарекува URL-кодирање, URL-кодирано или проценти-кодирање .
Пример за кодирање може да се види наВикипедија на руски јазик, која го користи рускиот јазик во URL-то. На пример, линија како:
https://ru.wikipedia.org/wiki/Wikipedia
кодирани како:
https://ru.wikipedia.org/wiki/%D0%92%D0%B8%D0%BA%D0%B8%D0%BF%D0%B5%D0%B4%D0%B8%D1%8F
Имплементација
Конверзијата се одвива во две фази: прво, секој кириличен знак е кодиран во UTF-8 во низа од два бајта, а потоа секој бајт од оваа секвенца е напишан со хексадецимална нотација , пред која стои знак за проценти (%):
B → D0 и 92 →% D0% 92 и → D0 и B8 →% D0% B8 k → D0 и BA →% D0% BA и → D0 и B8 →% D0% B8, итн.
! | * | ' | ( | ) | ; | : | @ | & | = | + | $ | , | / | ? | # | [ | ] |
A | B | C | D | E | F | G | H | I | J | K | L | M | N | O | P | Q | R | S | T | U | V | W | X | Y | Z | |
a | b | c | d | e | f | g | h | i | j | k | l | m | n | o | p | q | r | s | t | u | v | w | x | y | z | |
0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | - | _ | . | ~ |
Сите други знаци во URI се кодирани.
Резервираните знаци се кодирани на следниов начин:
! | " | # [6] | $ | % | & [6] | ' | * | + | , [6] | : [6] | ; [6] | < | = [6] | >> | ? [6] | [ | ] | ^ | ` | { | | | } | <просторот> |
% 21 | % 22 | % 23 | % 24 | % 25 | % 26 | % 27 | % 2А | % 2B | % 2С | % 3А | % 3Б | % 3С | % 3D | % 3Е | % 3F | % 5Б | % 5Д | % 5Е | % 60 | % 7Б | % 7С | % 7Д | % 20 [7] |
Кодирањето на параметрите во Internet Explorer и стариот Firefox е нешто различно [8] .
Во некои случаи, URL -то е формирано со кодирање Base58 [9] .
Стандард на ИРИ
Бидејќи буквите од сите азбуки, освен основната латиница , претрпуваат таква трансформација, URL -то со зборовите на огромното мнозинство јазици може да стане нечитливо за некоја личност.
Сето ова е во спротивност со принципот на интернационализам , објавен од сите водечки организации на Интернет , вклучувајќи ги и W3C и ISOC . Овој проблем е повикан да одлучи за стандардот на ИРИ ( инж. Интернационализирани ресурси идентификатор) - Меѓународни идентификатори на ресурси, што не би било проблем да се користат знаци на Уникод, и кои затоа не ги повредуваат правата на другите јазици . Тешко е однапред да се каже дали ИРИ некогаш ќе ги заменат таквите широко користени URL -адреси (и URIs воопшто).
Ограничување на должината
Формално, должината на URL -то не е ограничена, но прелистувачите имаат ограничувања на должината на URL -то. Не се препорачува да се користат URL -адреси подолги од 2048 знаци, бидејќи Microsoft Internet Explorer го има ова ограничување [10] .
PURL иницијатива
Друга голема маана во URL -адресите е нејзината недостаток на флексибилност. Ресурсите на World Wide Web и Интернетот се поместуваат, но URL -линковите остануваат, укажувајќи на исчезнатите ресурси. Ова е особено болно за дигиталните библиотеки, каталози и енциклопедии. За да се реши овој проблем, беа понудени постојани локатори PURL ( Eng. Persistent Uniform the Resource Locator). Во суштина, ова се исти URL -адреси, но тие не укажуваат на одредена локација на ресурсот, туку на запис во базата на податоци PURL, каде што, пак, специфичната URL -адреса на ресурсот е веќе снимена. При пристап до PURL, серверот го наоѓа потребниот запис во оваа база на податоци и го пренасочува барањето до одредена локација на ресурсите. Ако адресата на ресурсот се промени, тогаш нема потреба да ги поправите сите безброј врски до него - само треба да го смените записот во базата на податоци. Во моментов, оваа идеја не е стандардизирана и не е широко прифатена.
исто така види
Забелешки (уреди)
- ↑ URL (Uniform Resource Locator) - Единствен локатор на ресурси. Адресата на информативниот ресурс (датотека) на Интернет - Збирка акроними од областа на компјутерската технологија и програмирање . 2006 година.
- ↑ На двојно коса црта во интернет адреси појави како резултат на Брзината на неговиот творец РИА Новости (2009-10-14 19:05). Преземено на 11 јули 2010 година. Архивирано на 25 август 2011 година.
- ↑ Креаторот на интернет жали за двојно коса црта 3DNews Daily Digital Digest.14 октомври 2009 година.
- ↑ На Chrome URL Датум на лекување: 9 декември 2014 година.
- ↑ 1 2 RFC 3986 Дел 2.2
- ↑ 1 2 3 4 5 6 7 Знакот е дозволен, но кога е наведен во обичен текст има посебно синтаксичко значење
- ↑ МедијаВики избегнува кодирање на празниот простор како% 20, наместо тоа, наместо тоа, се заменува со подзнак „_“. Многу пребарувачи го заменуваат просторот со симболот "+".
- ↑ HTTP, RFC 3986 и прелистувачи
- ↑ Flickr услуги
- ↑ Максималната должина на URL во Internet Explorer е 2083 знаци . microsoft.com.