cookie

نحن نستخدم ملفات تعريف الارتباط لتحسين تجربة التصفح الخاصة بك. بالنقر على "قبول الكل"، أنت توافق على استخدام ملفات تعريف الارتباط.

avatar

Лингвопанк

Язык влияет на мышление — нам нужно разнообразие языков и письменностей. Ведёт @sitnik. Читайте также мои @lostinwiki и @sitnikfriday.

إظهار المزيد
مشاركات الإعلانات
1 507
المشتركون
+324 ساعات
+87 أيام
+3930 أيام

جاري تحميل البيانات...

معدل نمو المشترك

جاري تحميل البيانات...

Помните, в «Звездных войнах» были милые похожие на медвежат существа под названием эвоки? Они еще говорили на странном языке — вот тут можно посмотреть на них и послушать. 📝 Узнала, что язык эвоков создан на базе калмыцкого. Дело было так: Бен Бёртт, звукорежиссер «Возвращения джедая», смотрел документальный фильм и услышал там калмыцкую речь. Ему так понравилось звучание, что он нашел 80-летнюю носительницу языка и попросил ее записать на аудио калмыцкие сказки. Потом эти записи передали специалистам и попросили на их основе написать для эвоков реплики, которые бы имели калмыцкое звучание. Носители языка даже пишут, что в речи эвоков можно выхватить целые словосочетания на калмыцком, видимо, целиком взятые из исходных аудио. Если у меня тут есть говорящие на калмыцком, пишите, правда ли это :)
إظهار الكل...
15🔥 6👍 5
Квадратный молитвенник, Кот-д’Ивуара, вероятно, XIX век https://x.com/CellardEleonore/status/1797621290456805602
إظهار الكل...
14🤩 1
Расскажу вам сегодня историю про Олимпийские игры и алфавит :) В 1921 году Международный олимпийский комитет постановил, что на церемонии открытия Игр команды должны выходить «в алфавитном порядке по названию страны». Чего МОК не учел, так это того, что алфавиты в разных странах вообще-то могут отличаться. И в 1949 году появилось уточнение: «в алфавитном порядке, который принят в языке принимающей страны». 📝 Чего МОК снова не учел, так это того, что вообще-то есть страны и с неалфавитной письменностью. В 1964 году Олимпиада проводилась в Японии, где три системы письма: кандзи (иероглифы китайского происхождения), а также хирагана и катакана (слоговые азбуки). Комитет пожал плечами и распределил выход сборных в соответствии с английскими названиями стран и английским алфавитом (Япония молча согласилась). 📝 В 1988 году Южная Корея не стала терпеть такое безобразие. Напомню, что корейская письменность — хангыль — это своеобразный алфавит, который состоит из 51 чамо. 24 чамо — это эквиваленты буквам обычного алфавита, остальные 27 — это комбинации из двух или трёх букв. Так вот, на открытии Игр в Сеуле первой (после сборной Греции, которая традиционно открывает шествие) вышла сборная Ганы, затем — Габона, потому что слог ga — первый слог хангыля. 📝 Апогеем нашей истории стал Китай — страна с полностью иероглифической письменностью. Поддаваться влиянию западных алфавитов китайцы, конечно, не стали и использовали свою систему классификации. В 2008 году порядок выхода сборных зависел от количества и порядка написания черт в иероглифах названия страны на китайском языке: ✅ страны с меньшим числом черт в первом иероглифе шли раньше ✅ при равенстве числа черт в первом иероглифе рассматривался порядок написания черт в нём (подробнее об этом рассказывала тут) ✅ при одинаковом первом иероглифе по тому же принципу сравнивались вторые По этому принципу Гвинея (几内亚) шла первой, так как в её китайском названии первый иероглиф содержит всего две черты (几). Делегация Австралии (澳大利亚), почти всегда идущая одной из первых, в этот раз выходила под номером 202, сразу перед Замбией (赞比亚), которая шествовала предпоследней: первые иероглифы (澳 и 赞) этих стран пишутся в 15 и 16 черт соответственно. Такие дела!
إظهار الكل...
🤯 15🔥 9👀 3👍 2 1🐳 1
Я всегда очень радуюсь, когда люди изучают и сохраняют свои родные малые языки. Поэтому с удовольствием делюсь с вами новостью от коллег из Новосибирского госуниверситета о дипломной работе выпускницы этого вуза Дари Батуровой, которая делает огромное дело для сохранения и развития бурятского языка: она вместе с коллегами создала русско-бурятский параллельный корпус текстов и улучшила существующую модель машинного перевода.
«Бурятский язык является малоресурсным. В онлайн-переводчиках он не представлен. В Интернете можно найти разве что электронные словари или разговорники. Молодежь не выражает сильной заинтересованности в сохранении и продвижении бурятского языка, передача его из поколения в поколение, к сожалению, происходит все реже. Согласно переписи населения России, в 2002 году 79% бурят указали, что владеют бурятским языком, в 2020 же году — 63%. А между тем бурятский язык внесен в «Атлас языков мира, находящихся под угрозой исчезновения» ЮНЕСКО со статусом «есть угроза исчезновения», — рассказывает Дари.
Машинный перевод — это один из способов цифровизации языка, но из-за ограниченности данных с бурятским возникает такая проблема как сдвиг данных. Сдвиг происходит, когда модель машинного перевода обучается на наборе данных, который не охватывает все особенности семантики, лексики и синтаксиса языка, и из-за этого модель выдает неточный перевод. 📝 Дари взяла самую хорошую на данный момент модель машинного перевода и проанализировала ее поведение при сдвиге данных. Для этого был создан русско-бурятский параллельный корпус текстов с аннотированными предложениями по типам ошибок, которые совершила исходная модель при переводе текстов, содержащих научные термины. Так исследовательница выделила лучшую метрику для определения уверенности модели в своих переводах и выявления возможных ошибок. Пока алгоритм представлен в виде кода, но Дари намерена преобразовать его в сайт с русско-бурятским онлайн-переводчиком. Она работает над этим вместе с выпускницей СПбГУ Сараной Абидуевой, которая создала первую нейросетевую модель для русско-бурятского перевода в рамках своей дипломной работы. (А до этого девушки планируют выложить алгоритм и корпус текстов на Hugging Face). 📝 И про корпус текстов. Работать над ним Дари начала еще на третьем курсе, взяв за основу тексты новостей. Затем получила республиканский грант, на который смогла привлечь к работе трех специалистов, переводивших эти новости (сегодня переведено уже более 4 тысяч текстов, и работа продолжается: Дари ищет новых переводчиков и дообучает нейросеть). Такая вот прекрасная история. Носители бурятского (или изучающие его), рассказывайте, как вообще у вас обстоят дела с учебными пособиями, книгами, фильмами и прочим? Напомню, что здесь я делилась проблемами в изучении карельского, тут мы обсуждали положение чувашского языка, а здесь можно найти информацию о статусе разных языков России.
إظهار الكل...
🔥 12
Repost from N/a
мне нравится, что в скандинавских языках есть отдельное слово en älv для больших северных рек, в то время как все остальные большие реки зовут en flod
إظهار الكل...
22
Черкесский алфавит сейчас основан на кириллице. Но есть проекты на основе старых знаков — мифоэпические алфавиты. http://apsnyteka.org/1356-daur_cherkesskaya_kalligrafiya.html
إظهار الكل...
25🔥 5🍌 2
Photo unavailableShow in Telegram
Письмо "индостанского патриарха", которое предъявлял Аркадий
إظهار الكل...
9
Певучесть архангельских диалектов В говорах средней полосы интонация помогает членить речевой поток на отдельные отрезки. При этом во многих северо-русских говорах наблюдается изменение частоты основного тона на каждом фонетическом слове. В этих диалектах каждое слово начинается с более высокого тона, который к концу слова понижается, а группировка слов в синтагмы как бы отсутствует. Для передачи смыслового значения в северо-русских говорах используется резкая смена тональных уровней. Наряду с большим количеством диалектных слов это приводит к значительному уменьшению разборчивости северной речи для носителей других интонационных систем, т.к. становится очень сложно вычленить более существенные и менее существенные отрезки высказывания, которые в литературном русском языке маркируются именно при помощи интонации. Таким образом, можно выделить три характерные особенности северных говоров: • быстрый темп речи, • обилие частиц, • и пословное интонационное оформление. Эти говоры отличаются большим диапазоном изменение тона, за счёт чего речь их носителей воспринимается как более певучая. Источник: Л.Л. Касаткин «Русская диалектология», изд. «Академия», 2005 год ✍️ @linguamuza #славянские_языки #фонетика
إظهار الكل...
Пример архангельского говора.mp31.01 KB
🔥 9👏 2👍 1
Photo unavailableShow in Telegram
В русском языке тоже был определённый артикль (как the в английском). В некоторых диалектах для этого использовалась частица -то. — У меня вот у тяти-то отец Роман-от — жили в этой деревне. — Грибы-тe белые на нитке купила.
إظهار الكل...
🔥 29 6🤯 6🤣 1
Repost from папа хуху
Photo unavailableShow in Telegram
Капча с китайского правительственного сайта - радость для лингвиста.
إظهار الكل...
❤‍🔥 18😱 17🔥 2💊 1