Домены на национальных языках – как они работают?

Домены на национальных языках – как они работают?Доменные имена, записанные с использованием символов национальных алфавитов, уже доступны в различных доменах верхнего уровня. Например, 28 апреля 2008 года регистрация многоязычных имён открылась в домене SU. Как же система DNS работает с многообразием алфавитов?

Ответ на этот вопрос довольно прост: система DNS с символами национальных алфавитов вообще не работает, предпочитая им привычную с начала 80-х годов прошлого века латиницу, записываемую в «древней» кодировке ASCII. Единственным дополнением буквенного набора латиницы, используемого в DNS, являются арабские цифры и дефис, также входящие в кодировку ASCII. Такое положение дел обусловлено тем, что для решения задачи «расширения алфавита» нельзя было воспользоваться коренной перестройкой всей системы DNS.

Работающая в глобальном масштабе DNS – это весьма сложная распределённая система из многих тысяч серверов, находящихся под управлением самых разных администраторов. У этой системы нет центрального «технологического управления». Кардинальное же изменение допустимого набора символов, используемого отлаженным за десятилетия программным механизмом, настолько глубоко затрагивало бы фундаментальные принципы обработки DNS-запросов, что программное обеспечение серверов пришлось бы фактически обновить полностью.

Проведение такой «операции обновления» в масштабах всего Интернета слишком рискованно. Попытка провести подобную реорганизацию вообще может завершиться крахом существующей системы имён. Поэтому для введения многоязычных доменов предложили технологию, работающую поверх существующей системы DNS и вообще не требующую каких бы то ни было изменений в последней.

Суть этой технологии в преобразовании имён на стороне пользовательского программного обеспечения, перед отправкой запроса в систему DNS. Для реализации «многоязычия», доменные имена с символами национальных алфавитов, которые пользователь набирает в адресной строке браузера, по специальному алгоритму преобразуются браузером в последовательности символов (в кодировке ASCII), допустимые в системе DNS.

Например, доменное имя “проверка.su” преобразуется в строку символов «xn--80adjurfhd.su», то есть, слову «проверка» соответствует строка «xn--80adjurfhd», все символы которой допустимы к использованию в «классической» DNS. Для того чтобы программные системы могли отличать представления многоязычных имён от «традиционных» доменов, все многоязычные представления снабжаются обязательным префиксом: «xn--».

Таким образом, система DNS, как и ранее, работает лишь с символами латиницы, с дефисом и арабскими цифрами, а многоязычные доменные имена функционируют на новом, более высоком, «уровне представления».

Только что описанная технология использования многоязычных доменных имён называется Punycode, она рекомендована ICANN (корпорацией, управляющей адресным пространством Интернета) и уже реализована в наиболее распространённых интернет-браузерах: в Internet Explorer 7.0 и в семействе версий Mozila Firefox 2.x.

В качестве источника алфавитов для записи доменных имён в технологии Punycode служит современный стандарт компьютерных кодировок символов UNICODE. Главное преимущество UNICODE – это многообразие поддерживаемых этим стандартом наборов символов, среди которых представлены практически все распространённые в мире системы письма. Другими словами, использование UNICODE и Punycode позволяет реализовать самые разнообразные национальные символы в доменных именах, а не только, например, символы кириллицы или западноевропейские «умляуты».

Для того чтобы упорядочить регистрацию многоязычных имён, в тех доменах первого уровня, администраторы которых пока не хотят вводить «расширенные алфавиты», предложено зарезервировать имена, начинающиеся с префикса «xn--». То есть, такие имена будут недоступны для регистрации до введения поддержки многоязычия в данном домене. Например, в домене RU регистрация имён, содержащих «двойной дефис», запрещена.

Важным аспектом введения многоязычия в системе адресации Интернета является тот факт, что с точки зрения технических служб DNS, многоязычное имя - не более чем строка из цифр, символов латиницы и дефисов, начинающаяся с префикса «xn--». То есть, в базе данных DNS записывается лишь имя домена в формате «xn--…», а не аналог, состоящий из символов того или иного национального алфавита. Однако пользователя, зарегистрировавшего домен, скорее всего, привлекло именно второе представление, записанное символами национального алфавита, а не «абракадабра», начинающаяся символами «xn--». Следить за соответствием двух представлений доменных имён - «реального» и «технического», - а также решать возможные проблемы, возникающие из-за «двуличия» доменов, предстоит регистраторам и администраторам доменов верхнего уровня.

Интерес к многоязычным именам в системе адресации Интернета со стороны пользователей глобальной Сети достаточно велик. Технологии введения многоязычных имён уже отработаны и в ближайшем времени следует ожидать появления многоязычных доменов первого уровня (например, России могут выделить кириллический домен .РФ). 

 

Источник: site.nic.ru 

SocButtons v1.5

Добавить комментарий

Обращайтесь к посетителям сайта так, как вы хотите чтобы они обращались к вам

Защитный код
Обновить

Допрос

Сколько вы готовы платить за качественный интернет для личного пользования 100 Мбит/c на загрузку и отдачу?

Вы здесь: Главная Пресса Домены на национальных языках – как они работают?