Vlad Bout (karlsonmarxx) wrote,
Vlad Bout
karlsonmarxx

Популярная лекция о компьютерной лингвистике и прочие вопросы языкознания

Оригинал взят у gptu_navsegda в Популярная лекция о компьютерной лингвистике и прочие вопросы языкознания


Я с продуктами компьютерной лингвистики столкнулся еще в середине 90-х, уже тогда были не только текстовые редакторы с проверкой орфографии, но и переводчики под msdos которые уже тогда позволяли понять общий смысл текста. Вызывает искреннее удивление, что если верить лектору, только сейчас решили открыть первую кафедру. Вообще, недавно столкнувшись с текстами в старой орфографии я обнаружил, что словаря для проверке старой орфографии нет ни только в finereader, но и в openoffice. Finereader старую орфографию распознает, но исправлять ошибки по словарю нельзя. Так же не нашлось и профессиональных программ для перевода текста в новую орфографию, нашелся какой-любительский скрипт который пришлось дописывать:)
И вот натраховшись с этой, такъ любимой нѣкоторыми шизиками старой орѳографiей, я написал все что я думаю о современной заботе правительства о русском языке:

Минимальные меры которые давно надо было принять для поддержки русского языка

1. Оцифровка всех русскоязычных библиотечных фондов не ограниченных авторским правом (до 1940г.) и размещение их в открытый доступ в сеть.
2. Государственное финансирование основного набора компьютерных языковых инструментов: программ проверки орфографии, грамматики, синтеза и распознавания речи и т.д. Все эти инструменты должны распространяться бесплатно и поддерживаться для основных операционных систем и основных программных интерфейсов.
3. Государственное финансирование ежегодных конкурсов по разработки кириллических шрифтов и открытое их распространение.
4. Государственное финансирование наиболее общих русскоязычных, словарей, энциклопедий переводчиков и т.д. как в виде программ, так и виде интернет-сервисов.

На общественных или коммерческих началах вся эта работа делается и сегодня, но этой самодеятельности явно не достаточно, тем более, что речь идет не о поддержке вымирающего языка "лишь бы выжил", а речь идет о поддержке лидерских позиций, хотябы региональных, что требует серьезных затрат. Как пример отставания - русская грамматика для бесплатного OpenOffice содержит всего 150+ правил, а польская и французская 1000+ правил. Бесплатных русских голосов для синтезатора речи (ttf) всего два. Бесплатных кириллических шрифтов есть некоторое количество, но все-таки намного меньше английских.

Если мы хотим поддерживать русский язык как международный, то мы должны бороться за то чтобы любой болгарин или казах захотевший прослушать книгу через синтезатор, и не найдя ее на своем языке, мог легко найти ее на русском, и мог найти легальный бесплатный синтезатор русской речи. Любой программист который что-то пишет связанное с языком мог легко найти все необходимые библиотеки для русского языка и добавить его поддержку в свою программу.

Вместо этих реально необходимых и по настоящему эффективных мер, государство тратит деньги на дотирование никому ненужных литературных журналов и спонсирует какие-то там пушкинские фестивали или маргинальные горьковские чтения, как будто русский язык люди учат чтобы стихи читать... Эти мероприятия уже давно не соответствуют современной повестке дня и только пускают в глаза пыль создавая видимость поддержки языка.
Subscribe

  • (no subject)

    Наш старый знакомый бывший директор Google Эрик Шмидт и действующий председатель Комиссии национальной безопасности по искусственному интеллекту на…

  • (no subject)

    Юлия Навальная - гражданка Германии, как минимум с 2019 года. Возможно, что и у Алеши есть подобный документ. Правда, он ему еще не скоро…

  • Атака на Россию

    Отличная статья - советника Шойгу Андрея Ильницкого. Вы, может быть, прекрасно знакомы с автором, но я встречаю в первый раз, и мне очень…

  • Post a new comment

    Error

    Anonymous comments are disabled in this journal

    default userpic

    Your reply will be screened

    Your IP address will be recorded 

  • 0 comments