👁 Final Eye: блог о редактуре ИТ/медпереводов, техписательстве и обучении переводчиков
2 953
Subscribers
No data24 hours
+27 days
+4730 days
- Subscribers
- Post coverage
- ER - engagement ratio
Data loading in progress...
Subscriber growth rate
Data loading in progress...
03:03
Video unavailableShow in Telegram
По многочисленным двум просьбам в личке выкладываю описание глюка взаимодействия Excel и Figma при локализации пользовательских интерфейсов, и способ решения этой проблемы.
@alliancepro
Figma_Excel_glitch.mp423.90 MB
😁 4👍 3❤ 2
Photo unavailableShow in Telegram
Минутка хвастовства и скукоты :) .
Кажется, моя библиотечная эпопея с ручной сортировкой книг выходит на финишную прямую.
Мне удалось-таки сообразить, как сделать так, чтобы я только указывал папку и тематику, а Python сам просканирует библиотеку и перенесет туда наиболее релевантные книжки.
Это уже NLP в чистом виде — скрипт открывает книгу, репрезентативно выдергивает текст из книги (около 10 страниц), выбирает оттуда наиболее частые термины (самые обыкновенные слова отбрасываются через фильтр стоп-слов и плюс всякий мусор тоже фильтруется), и далее этот список частых терминов сопоставляется с тематикой каждой папки.
Папка, с которой коэффициент сходства (similarity) оказывается самым высоким, и становится новым домом для книжки - скрипт ее туда перекидывает.
Пока я пишу, скрипт работает - скриншотик оттуда.
Если кому надо будет код, пишите в личку.
@alliancepro
🔥 10👍 4👏 2
Редколлегия JAMA продолжает обжигать поликорректностью.
Зацените цитатку:
Although often regularly used in the past, the term committed suicide may imply that the act of suicide is criminal or morally wrong.
Оказывается, в суициде нет ничего плохого.
Ну да ладно, оставим это на совести авторов и авторок этого стайлгайда, а вот что реально важно для переводчика, так это рекомендованное словоупотребление (снова цитирую):
Avoid:
Committed or completed suicide Unsuccessful or successful suicide attempt Failed suicide attempt Suicide epidemic Killed themself Took their own life Ended their lifePreferred:
Died by suicide Death by suicide Suicide death Suicide attempt Fatal suicide behavior Person with suicidal ideationhttps://amastyleinsider.com/2024/05/31/language-to-discuss-suicide/ @alliancepro
Language to Discuss Suicide
Miriam Cintron, BA, JAMA Although often regularly used in the past, the term committed suicide may imply that the act of suicide is criminal or morally wrong.1 Likewise, referring to a suicide atte…
👍 5😱 3
Photo unavailableShow in Telegram
Эхо советской локализации. Сейчас за такое руки отрывают :-)
😁 16👍 1
А еще иногда ИИ-чат клинит, и на один и тот же промт он выдает совершенно разные ответы. Приходится несколько раз принудительно сбрасывать контекст, чтобы он наконец выдал то, чего я от него жду. Вот примеры.
Найдите 100500 отличий :)
😁 3
Про запросу издательства редактирую стенограмму лекций в книгу, и часто вспоминаю старый анекдот, про дедушку, внучку и дерьмо в речке.
Автор очень любит заходы, типа, а давайте поговорим про такую концепцию. Далее 3 страницы он обсуждает эту концепцию со студентами, я соответственно, все это осмысляю, причесываю, раскладываю по полочкам, чтобы все смотрелось стройно и логично. И тут как рояль из куста автор вытаскивает фразу: "Но все, что мы тут обсудили, имеет мало отношения к нашему предмету. Мы этот термин будем трактовать вот так-то".
Рука тянется к мачете кружке кофе.
😁 19
Интересно, дождемся ли такого по переводоведению?
Repost from BRIEF
Прием на специальность 51.02.03 «Библиотековедение» прекратят с 31 декабря 2024 года. В столице на библиотекарей не учат уже с прошлого, 2023 года. Решение принято из-за невостребованности профессии среди молодежи. Уже сейчас по статистике 80% работающих в библиотеке пришли из других сфер деятельности. На обслуживание читателей сокращение библиографов и библиотекарей не повлияет, «ведь библиотека компьютеризирована», — Парламентская газета.
❤ 7🤔 2
Я знаю, что часть моих читателей осторожно все-таки поглядывает в сторону Python и автоматизации, поэтому хочу показать вам очередную свою поделку — по прежнему с моей многострадальной библиотекой. Напомню, там несколько десятков тысяч книг по ИТ и медицине, и лопатить их вручную не представляется возможным.
Поскольку я собираю книжки в эту библиотеку с разных полупиратских сусеков, названия у этих книг тоже весьма разные. Зачастую получается так, что выкачиваю одну и ту же книгу с разных источников, и она отличается только на подпись источника (а если отличается хоть на букву - хеширование в поиске дубликатов не работает).
И вот мне пришла идея, а что если я буду считывать первые 5 страниц книги, и выбирать оттуда все слова, которые написаны с заглавной буквы или заглавными буквами. Наверняка у одинаковых книжек с разными названиями файлов сгенерируются одинаковые названия, плюс эти названия будут более или менее отражать название книги + авторов + возможно какие-то ключевые слова зацепим. Кроме того, если книги будут из одной серии - то и начало у них тоже будет похожее, значит по имени файла они сгруппируются в папке.
Кроме того, я решил, что будет нелишним выявить, каких букв в книжке больше - русских или латинских, с учетом этого сформируется префикс RU__ или EN__. И наконец, будет неплохо дописать к концу имени файла объем книги в страницах.
Третий день гоняю скрипт, делаю мелкие поправки, но в основном он уже работает. Подробности можно посмотреть в гугл-колабе по ссылке ниже, если надо - берите и пользуйтесь. На скриншоте - результат работы скрипта в папке с книжками по онкологии.
https://colab.research.google.com/drive/1_iQ0zlXvgNFSef3PLx1bKxavxxkY_ucv?usp=sharing
@alliancepro
Library Book Titles Generation.ipynb
Colab notebook
🔥 8👍 2