🤓Бартов: про работу с ИТ- и медтекстами и про всякое
Open in Telegram
Евгений Бартов, главред бюро переводов «Альянс ПРО» (ИТ, ИБ | медицина) Перевожу, редактирую, веду практику, пишу статьи, автоматизирую работу. В переводах с 1998 г. Для вопросов, запросов и предложений — @bartov_e
Show more2 472
Subscribers
-224 hours
-57 days
-2230 days
Posts Archive
Разбор ИТ-перевода: «обнаружение» или «система обнаружения» + локализация бренда
== 1. 📋 ДАНО ==
На редактуру попал фрагмент текста по кибербезопасности.
* Исходный текст:
Detection is like having a car alarm that goes off once they’re inside the car... (e.g. LoJack).
* Вариант переводчика: «Обнаружение похоже на автомобильную сигнализацию... (например, система LoJack)».
== 2. 🔍 ЧТО НЕ ТАК ==
Смущает два момента.
1. Обнаружение - это процесс. Сигнализация — предмет. Как их корректно сравнить?
2. Что такое LoJack?
Разберемся.
== 3. 🧠 ХОД РАССУЖДЕНИЙ ==
1. В английском под Detection is like... подразумевается не процесс, а система, что подтверждается дальнейшим контекстом, там используются фразы detection system и detection tools. Соответственно, автор сравнивает не процесс, а инструмент — «система обнаружения».
2. Далее, русскоязычному читателю скорее всего будет непонятен термин LoJack. При изучении выяснилось, что это коммерческое название американской системы возврата угнанных автомобилей, работающей на основе радиочастотного слежения (https://m.media-amazon.com/images/I/71wfFQN5jLL.jpg). Их бренд практически неизвестен в России. Для локализации рекомендовал переводчику дать описательный перевод, например, «спутниковая система слежения».
== 4. ✅ ПРАВКА ==
* Вариант переводчика:
Обнаружение похоже на автомобильную сигнализацию, которая срабатывает уже после проникновения злоумышленника в автомобиль, отправляет оповещение владельцу и помогает отслеживать машину даже после угона (например, система LoJack).
* Вариант редактора:
Система обнаружения чем-то схожа с автомобильной сигнализацией, которая срабатывает при взломе, шлет оповещение и помогает отследить угнанную машину (например, через спутниковую систему слежения).С 1-го июля повышаю тариф на услуги обучения до 1750 за час /12500 за 10 часов.
Если кому надо зафиксировать нынешний тариф 1500 и 10000 руб. соответственно, пожалуйста, дайте о себе знать до 1-го июля.
Спасибо.
Разбор ИБ-перевода: размытый смысл указательного местоимения
== 1. 📋 ДАНО ==
На редактуру попал фрагмент перевода по теме кибербезопасности, описывающий атаку с перезаписью Trace‑Handle. Исходный текст:
«It requires the operator to have an arbitrary read‑write primitive in a vulnerable driver, such as those present in previous versions of Gigabyte’s atillk64.sys and LG Device Manager’s lha.sys…»
Вариант переводчика:
«Для ее применения оператор использует уязвимости драйвера, дающие возможность чтения и записи в памяти по произвольным адресам, как это было с предыдущими версиями Gigabyte atillk64.sys и lha.sys от LG Device Manager…»
== 2. 🔍 ЧТО НЕ ТАК ==
Я обратил внимание, что русский вариант «как это было с предыдущими версиями» не устраняет размытость, созданную через конструкцию such as those:
Грамматически such as those может быть прицеплено к:
- primitive → «такие примитивы, какие были в…»,
- vulnerable driver → «такие уязвимые драйверы, какие были в…»,
- отдалённо к vulnerability (хотя в тексте нет слова vulnerability отдельно).
Так к чему же оно относится? Разберемся.
== 3. 🧠 ХОД РАССУЖДЕНИЙ ==
1. Представим себе ИТ-инфраструктуру как охраняемый объект. Внутрь пускают только машины с пропусками (для ИТ-инфраструктуры это драйверы).
2. На объекте есть главный охранник (антивирус/EDR). Чтобы видеть всё, он использует тайного информатора EtwTi, который сидит глубоко в подвале (в ядре системы) и непрерывно шлёт отчёты: «процесс 5 читает чужую память», «процесс 12 запускает подозрительный код». Без этих отчётов охранник слепнет.
3. Злоумышленник хочет ограбить объект, но знает, что EtwTi сразу его сдаст. Удалить или убить информатора нельзя — он часть системы. Поэтому хакер готовит атаку «только на данные» (Data‑Only Attack): он не трогает код EtwTi, а тихо переписывает одну его настройку в памяти.
4. ХОД АТАКИ:
- Шаг 1 атаки — найти «своего» легального драйвера (BYOVD). Злоумышленник берёт старую версию официально подписанного драйвера, в котором производитель случайно оставил уязвимость. Примеры таких машин с пропусками, но с трещиной в броне: atillk64.sys от Gigabyte и lha.sys от LG Device Manager. Антивирус им изначально доверяет.
- Шаг 2 — получить «супер‑возможность» (примитив произвольного чтения/записи). Через уязвимость в этом драйвере хакер обретает возможность читать и писать данные по любому адресу в памяти ядра. Технически это называют примитивом произвольного чтения и записи (arbitrary read‑write primitive). Это не сам драйвер, не его уязвимость, а именно способность, которую уязвимость даёт. Ситуацию можно сравнить с тем, что хакер получил прибор, способный открыть любой сейф в здании и переписать любую бумагу.
- Шаг 3 — испортить отчёты. Обладая этой способностью, хакер находит в памяти ядра «блокнот» с настройками EtwTi. Там есть строка: Отправлять отчёты = ДА (1). Своим прибором он меняет одну цифру на НЕТ (0).
5. По итогу EtwTi продолжает работать, видит ограбление, но из‑за изменённой настройки просто молчит. Главный охранник считает, что всё тихо, а хакер делает что хочет.
== 4. ✅ ПРАВКА ==
🤫
* Вариант переводчика:
...использует уязвимости драйвера, дающие возможность чтения и записи в памяти по произвольным адресам, как это было с предыдущими версиями...* Вариант редактора:
...использует уязвимости драйвера, дающие возможности чтения и записи в памяти по произвольным адресам, подобные тем, что были в предыдущих версиях...
Разбор ИБ-перевода: «кража данных» или «эксфильтрация данных»
== 1. 📋 ДАНО ==
На редактуру попал фрагмент текста по информационной безопасности.
Оригинал:
Precisely because many organizations developed stronger backup and DR systems, ransomware attacks evolved, with one of the most significant trends being the incorporation of data exfiltration for use as leverage in extorting the victims to pay the ransom.Перевод:
Поскольку организации улучшили системы резервного копирования и аварийного восстановления, вымогательские атаки тоже эволюционировали. Одним из главных трендов стала кража данных, используемая как рычаг давления для принуждения к уплате выкупа.== 2. 🔍 ЧТО НЕ ТАК == Переводчик написал exfiltration = кража. Действительно ли термины "эксфильтрация" и "кража" взаимозаменяемы? Нет, объясняю почему. == 3. 🧠 ХОД РАССУЖДЕНИЙ == 1. «Кража» — это бытовой и юридический термин. Он описывает сам факт, что у злоумышленника неправомерно появилась копия чужих данных. Оригинал при этом может оставаться на месте. 2.
Data exfiltration («эксфильтрация данных») — это технический термин, характеризующий процесс кражи. Специфика этого процесса: несанкционированный (это само собой), но ключевой момент — это скрытный *вывод* данных за пределы защищенного сетевого периметра.
3. Это значит, что злоумышленники не просто копируют информацию. Чтобы обойти системы обнаружения утечки данных, они используют специальные методы: сжимают и шифруют архивы, передают данные очень медленно и мелкими частями (data throttling), часто маскируют их под легитимный трафик (например, под трафик запросов к DNS-серверам).
4. Из этого следует, что «эксфильтрация» — не синоним «кражи». В оригинале этот термин используется намеренно, чтобы подчеркнуть техническую сложность процесса вывода данных. В современных атаках с двойным вымогательством (double extortion - выкуп требуют и за сохранение конфиденциальности данных, и за их расшифровку) это ключевой этап, а не просто копирование файлов.
== 4. ✅ ПРАВКА ==
Вариант переводчика:
Одним из главных трендов стала кража данных, используемая как рычаг давления для принуждения к уплате выкупа.Вариант редактора:
Одним из главных трендов стала эксфильтрация данных, используемая как рычаг давления для принуждения к уплате выкупа.
По работе немножко завал, поэтому пардоньте, на большие статьи времени нету. Ограничусь пока короткими заметками (как раньше на карточках), благо материала такого хватает.
Разбор ИТ-перевода: «определение списка» или «литерал списка»
== 1. 📋 ДАНО ==
На редактуру попал фрагмент текста о программировании в Python.
Исходный текст:
«Хранимые в списке данные определяются как разделенные запятыми значения, заключенные в квадратные скобки. Списки можно определять используя любое имя переменной, а затем присваивая ей различные значения в квадратных скобках».
Вариант переводчика:
«The data stored in a list is defined as comma-separated values enclosed in square brackets. Lists can be defined by using any variable name and then assigning various values in square brackets».
== 2. 🔍 ЧТО НЕ ТАК ==
Основная проблема: исходный текст содержит техническую неточность, и переводчик её продублировал.
Оригинальные и переведенные формулировки смешивают два разных понятия: структуру данных в памяти компьютера (list) и её текстовое представление в коде (list literal). Также неверно описан процесс связывания списка с переменной. Поясняю подробнее.
== 3. 🧠 ХОД РАССУЖДЕНИЙ ==
1. В программировании необходимо различать объект (структуру данных
list) и его синтаксическое представление в исходном коде, которое называется «литерал» (list literal).
2. Утверждение, что список «определяется как значения в скобках», не всегда верно. Список можно создать и другими способами, например, динамически из файла или с помощью функции list(range(10)). В этих случаях в коде нет литерала [...].
3. В памяти компьютера объект-список не содержит ни скобок, ни запятых. Это элементы синтаксиса языка, а не самой структуры данных.
4. Утверждение, что списки «определяются именем переменной», также неточно. Происходит два отдельных действия: сначала создается объект-список, затем ссылка на него присваивается переменной. Переменная лишь именует объект, а не определяет его.
5. Следовательно, корректно говорить о «литерале списка», который *записывается* определенным образом, и о *создании* списка с *присваиванием* его переменной.
== 4. ✅ ПРАВКА ==
Вариант переводчика:
The data stored in a list is defined as comma-separated values enclosed in square brackets. Lists can be defined by using any variable name and then assigning various values in square brackets.
Вариант редактора:
A list literal is written as a comma-separated sequence of items enclosed in square brackets. You create a list by assigning a list literal to a variable.Наконец-то дошли руки до того, чтобы сделать страничку с описанием услуги по наставничеству/подготовке ИТ-переводчиков для издательства «Питер».
Если вдруг кто-то присматривался к этой услуге, велком. До конца октября я групповые курсы не планирую, так что если хотели посвятить лето изучению ИТ-переводов, чтобы уже по осени заключить контракт с издательством, можете обратить внимание и на эту возможность.
Отмечу, что конкретно по этой книге есть возможность зайти на сокращенную программу (т.е. без подготовки набора/форматирования и глоссария) — у меня на руках уже есть готовый текст и готовый глоссарий. Можно просто будет сразу приступить к переводу.
Также отмечу, что в рамках этого курса можно будет пройти и сокращенный курс автоматизации работы переводчика (тот самый конвейер, по которому я читал отдельный курс).
В общем, заглядывайте на страничку, я там вроде бы все подробно расписал (если что-то упустил важное, пишите в личку, контакты на странице есть).
https://tran.su/service/it-translation-tutor/
Первое, за что зацепился глаз — студент перевел image как «копия». В контексте ИТ это грубая ошибка — между этими понятиями пропасть.
Простое копирование — это операция на уровне файловой системы. Когда вы копируете папку с файлами с одного диска на другой, операционная система считывает содержимое файлов и записывает их на новое место. При этом их физическое расположение на новом диске, скорее всего, будет совершенно другим. Если вы так скопируете системный диск на новый носитель, а потом попытаетесь с него загрузиться — ничего не выйдет. Программы не запустятся, потому что нарушена вся структура, которую они ожидают.
Создание образа (imaging) — это совсем другой процесс...
Продолжение на https://dzen.ru/a/ag4Pt88SkjJ04Gin
(Мы в МАХ)
Про трактовку термина boolean
... добравшись до главы 10.4 Not using proper BOOLEANs я вдруг осознал, что я явно недооценивал глубину понятия «булевых» значений. Большинству этот тип данных известен по известным логическим значениям "ИСТИНА" и "ЛОЖЬ". Но с этим термином всё гораздо сложнее и многообразнее.
Продолжение https://dzen.ru/a/afhzofrI7SJ8j_PL
(Мы в МАХ)
Однажды переводчик мне сдал перевод презентации в билингве SDL Trados (*.sdlxliff). Обычная презентация, русско-английский перевод, тема — ИТ-маркетинг, заказчик торопит.
Моя задача — проверить перевод презентации и подготовить ее «под ключ». Выгрузил я ее из билингвального файла. И тут, на этапе сверки, обнаружил деталь. В исходнике в заголовках и в конце пунктов маркированного списка никаких точек не было. А у переводчика они были везде, в конце каждого предложения (дурная привычка, у меня такая же).
Продолжение на https://dzen.ru/a/afMm9zXdaEJBobKt
(Мы в МАХ)
Недавно в клубе Read IT Club я увидел очередное объявление: ищут переводчика на книгу по AutoML. Тема модная, интересная. Но клуб, в основном занимается рецензированием готовых переводов.
Я же как раз учу именно ремеслу перевода ИТ-книг. И сейчас мы с группой работаем над книгой посложнее, чем просто ИТ, — по информационной безопасности: Learning Ransomware Response & Recovery.
В ней 16 глав, и это 16 потенциальных мест для переводчиков. Четыре уже заняты, осталось 12.
И начали мы не с перевода. Начали мы с ада. С форматирования.
Дело в том, что издательству не нужен просто перевод. Ему нужен полуфабрикат, готовый для верстки. И оно очень придирчиво к неряшливому форматированию. Если вдруг вы подумали, что можно просто прогнать PDF через распознавание, закинуть в CAT-инструмент и сдать в таком виде — у меня для вас плохие новости.
Уже на этапе CAT-инструмента вы получите «грязный» текст, полный артефактов, и документ, который развалится от любого чиха (помните шуточку, про «я пододвинул картинку, и текст уехал в Воронеж»? — это оно).
Продолжение по ссылке: https://dzen.ru/a/ae_YjUdkTWAf1vNn
(Мы в МАХ)
Repost from N/a
+1
Лед тронулся, господа присяжные заседатели.
Картинку на русском нарисовала мне NanoBanana! 💃💃💃
— Да, я написала ей, как что переводится.
— Да, она до сих пор умеет клепать только квадратные изображения, поэтому в выдаче пришлось подрезать поля.
— Да, это за деньги (примерно 50-75 рублей за генерацию).
Но это без Photoshop, возни мышкой по слоям и подбора шрифтов. 🏆
А рисуночков у меня в ближайший месяц ожидается ой-ой-ой-ой сколько. Может, и чертеж какой простенький квадратиками скормлю 🤞
После моего курса про переводческий конвейер лайфхаки с него пошли в эфир.
Судя по явно более слабой реакции на медицинские публикации, рискну предположить, что медицинские переводчики из этой группы либо устранились, либо отписались.
Публикации на какую тему вас интересуют больше других?
.. эта книга оказалась настоящим минным полем для медицинских переводчиков. Настолько, что мы даже провели вебинар по разбору одной из глав, где обсуждали, как не подорваться на терминах вроде «16G» или «shaft» и почему важно проверять имена исследователей.
Меня накрыла ностальгия и я пошел разбирать наш старый проектный чат. Наткнулся на один из многочисленных примеров — простой, но наглядный.
Итак, вот оригинал:
Although usual femoral or jugular arterial and venous access can be used in larger children and adults (see Chapter 6), special access routes are usually required in neonates and infants.Выглядит просто, но есть нюансы. Книга, как вы видите из обложки, посвящена вопросам катетеризации сердца. Чтобы добраться до правых отделов сердца, нужен доступ через вену. Чтобы добраться до левых — через артерии. Это база. Теперь смотрим на фразу: femoral or jugular arterial and venous access. Автор видимо так торопился, что у него получилась фраза, которая в быту могла бы звучать как-то типа «у меня есть глобус или карта мира и Томска». Из-за такой грамматики получилось, что эта фраза распадается на 4 варианта... Продолжение см. на https://dzen.ru/a/aeuMTRq7NUa53FNx (Мы в МАХ)
Как-то раз я получил от переводчика такое предложение из ИТ-книги:
В этом блоге (https://...) описано решение проблемы 1 + n с использованием дата-лоадеров.Слово «дата-лоадер» аж резануло глаз — слишком уж чужеродно. Было ощущение, что переводчик его не понял, но на всякий случай транскрибировал и пошел дальше. Иду в оригинал:
A solution of the 1 + n problem using dataloaders is described in this blog (https://...).Так-то вроде все сходится, не раз такое бывало, когда видишь незнакомый термин, он тебе кажется чужеродным, ты начинаешь править до тех пор, пока потом не выясняется, что ты динозавр, у тебя дыра в знаниях и сейчас уже все так переводят. И все же я решил перестраховаться, чтобы потом перед издателем не краснеть за переводчика. Итак, разберемся. Продолжение см. на https://dzen.ru/a/aXQKwuHx3jg5Ve2C (Мы в МАХ)
Однажды ко мне обратился клиент с весьма редким для моей специфики запросом — попросил сделать ему закадровый перевод художественного фильма с немецкого языка с помощью ИИ. До сих пор я такие вещи делал для коммерческого контента, вручную, на совесть и за соответствующую плату.
Но чтобы Вы поняли всю глубину ситуации, нужно сделать шаг назад.
Незадолго до этого ко мне обращался один популярный психолог (не лично, конечно, через помощников, но не суть).
Задача: перевести его лекции на английский, озвучить разными голосами (чтобы заказчик мог выбрать варианты), тоже с помощью ИИ, плюс добавить субтитры.
Распознать и сгенерировать речь с помощью моих Python-скриптов или используемых мною сервисов — не проблема. А вот дальше начинался филиал ада.
Продолжение на https://dzen.ru/a/aeiqxUxPtx4UKDjx
Однажды ваш покорный устал от рутины и пошел в гости к ИИ. Дело в том, что я, когда проверяю работы студентов в виде двухколоночной таблицы-билингвы, постоянно сталкиваюсь с одной и той же проблемой: текст в ячейках лежит монолитом, без разбивки на предложения. Заниматься разбивкой таких текстов и растаскивать предложения по ячейкам вручную — еще то удовольствие.
Вот я психанул и пошел к ИИ. Зная, какие вещи мне ИИ выдавал на Python, я посчитал, что тут будет фигня делов, поэтому написал ему по-простому, сходу:
«Напиши макрос для Word, который будет разбивать текст в таблице на предложения».Дальше началось интересное — ИИ начал чудить. Продолжение на https://dzen.ru/a/aednXZI492PcqVvA (Мы в МАХ)
Вы когда-нибудь слышали про программы-вымогатели? Они попадают на компьютер в виде троянов, незаметно шифруют все данные, до которых могут дотянуться, а потом в один прекрасный день у вас на экране выплывает заставка — платите деньги, иначе мы сотрем все ваши данные.
И люди несли. Очень в свое время прославился такой деятельностью троянец под именем Petya - погуглите если интересно, делов он много разных наделал.
К чему я все это говорю — книгу мне прислали именно про такой тип вирусов: как они работают, как от них защищаться и т.п. То есть это книга про кибербезопасность.
Условия такие:
- Получаете книгу, берете кусочек, переводите кусочек, показываете мне.
- Я его разбираю, подсвечиваю ошибки, если необходимо, возвращаю на доработку. Либо, если там все хорошо - берем новый кусочек, в 2 раза больше.
- Если три-пять переводов подряд по вашим переводам серьезных правок нет, я вас знакомлю с менеджером книги в издательстве, и вы дальше работаете с ним - либо по этой же книге, либо он вам выдаст другую.
- Если забираете эту же книгу, то гонорар за оставшуюся часть тоже заберете себе.
- Я себе забираю гонорар за разобранную часть + почасовую оплату (обычно 1000 руб. за один разбор).
Таким образом, успешный студент получает:
1. Постоянного клиента — издательство (возможно, еще одного клиента в виде меня — так как от меня тоже могут приходить заказы).
2. Строчку в резюме.
3. Новую тему для своих клиентов.
4. Возврат вложений (гонорар за книгу явно превышает обычные затраты на обучение ИТ-переводу).
Кому интересно, пишите на t.me/bartov_e
Чтобы не быть голословным, объявляю открытым набор желающих учиться ИТ-переводу на материале книги открытым.
Available now! Telegram Research 2025 — the year's key insights 
