ch
Feedback
Код в мешке

Код в мешке

前往频道在 Telegram

Код в мешке - про кодинг, и не только... Это личная записная книжка https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w

显示更多
250
订阅者
无数据24 小时
-17
-530
帖子存档
Иллюзия анонимности: почему Telegram Wallet не спасет от контроля ФНС #habr https://habr.com/ru/articles/1033286/ Tags: криптовалюты, криптобиржи, фнс, росфинмониторинг, регулятор, налоги, банки, telegram, wallet Author: strannik96

Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей #habr https://habr.com/ru/articles/1033450/ Tags: LLM, GPT, Claude, sampling, temperature, prompt engineering, постобработка, детекция ИИ-текста, RLHF Author: nlaik

Веселимся со Spring: pet-проект по распознаванию речи #habr https://habr.com/ru/articles/1033338/ Tags: Java, Spring Framework, Vosk, speech recognition, распознавание речи, REST API, WAV, Java Sound API, pet project, веселье Author: rurikovich

Эра личных секретарей #habr https://habr.com/ru/articles/1033442/ Tags: ai, llm, ии, ии-ассистент, ии помощник Author: amcured

Как я спроектировал систему защиты от протечек воды, или аккумулятор с транзистором побеждают бога морей #habr https://habr.com/ru/articles/1033438/ Tags: diy, multisim, proteus, печатные платы, защита от протечек Author: lukon

Почему российский бизнес проигрывает битву за информацию и как это исправить. Часть 2 #habr https://habr.com/ru/articles/1033430/ Tags: качество данных, scd, slowly changing dimensions, темпоральность, миграция данных, sap, импортозамещение, etl, sql, системный анализ Author: vasyukovevgeny

Нейросеть для презентаций: ТОП-10 ИИ инструментов как сделать презентацию бесплатно #habr https://habr.com/ru/companies/ranvik/articles/1033316/ Tags: ии, презентация, gemini, gpt, midjourney, claude, нейросети, grok, nano banana, flux Author: VisionSoul (Ranvik)

Полный гайд по dunder-методам в Python (от новичка до профи) #habr https://habr.com/ru/articles/1033432/ Tags: ython, ООП, dunder-методы, магические методы, метапрограммирование, дескрипторы, итераторы, генераторы, контекстные менеджеры, Python 3 Author: enamored_poc

Из настроек Chrome пропало сообщение о приватности локального ИИ Gemini Nano. Это может стоить Google миллиарды #habr https://habr.com/ru/news/1033392/ Tags: Google, Chrome, Gemini Nano

Исковая давность по дебиторской задолженности: как считать, не пропустить и использовать в свою пользу #habr https://habr.com/ru/articles/1032330/ Tags: срок исковой давности дебиторка, взыскание дебиторской задолж, пропуск срока исковой давн, прерывание исковой давности, приостановление исковой давн, дебиторская задолж взыскание, срок взыскания долга, арбитражный суд дебиторка, списание дебиторской задолж Author: ddconsult

Ваш Telegram-бот на базе LLM уязвим. Я написал сканер, чтобы доказать это на популярном Open Source проекте #habr https://habr.com/ru/articles/1033420/ Tags: llm, red teaming, информационная безопасность, prompt injection, telegram-боты Author: Peternsk

Claude Code — полный гайд и обучение для новичков с нуля #habr https://habr.com/ru/articles/1033416/ Tags: claude, ии, claude-code, искусственный интеллект Author: claudedev

Как навсегда побороть лишний вес и прийти в хорошую физическую форму #habr https://habr.com/ru/articles/1033406/ Tags: здоровый образ жизни, изменения Author: Terentew

Цифровой аудит против галлюцинаций по ГОСТу. Как понять, когда ответу ИИ нельзя верить? #habr https://habr.com/ru/articles/1033404/ Tags: ИИ, LLM, интерпретация ИИ, аудит ИИ, сравнение моделей, ChatCPT, Gemini, принятие решений Author: alislille

Не покупайте плохой VPN #habr https://habr.com/ru/articles/1033400/ Tags: vpn Author: Namilsky

Repost from Ivan Begtin
Почему я задумался про LLM Knowledge base и работу с базами знаний через LLM? У меня есть какое-то, немало количество материалов собранных из большого числа небольших записок и недописанных книг. Эти книги, изначально в формате лонгридов и страниц для Gitbook'а можно назвать существенными кусками (ядром) того что можно назвать доменной базой знаний, в понимании домена как очерченной предметной области. У меня таких областей было и есть несколько и вот сейчас без применения ИИ ассистентов работать с ними очень сложно. И из реально работающих инструментов реально наиболее оптимален Notion, но со всеми оговорками зависимости от его проприетарности. Идеальный инструмент - это продукт работающий локально на компьютере или в локальной сети, позволяющий вносить знания по предпопределенным профилям и шаблонам, с визуальным редактированием и совместной работы от 5 редакторов. Самое очевидное тут Mediawiki/Wikibase, с оговоркой что там внутри не Markdown, что там очень консервативное API и интеграции, и с не менее консервативными инструментами метаописания и редактирования. Тут я вспомнил что есть и другой путь. Переводить все документы в YAML и формировать их структурированными блоками. YAML/TOML файлы значительно проще редактировать сохраняя структурную целостность, заполняя метаданными и так далее, а конвертация в Markdown может быть автоматической/автоматизированной. Это неидеальный сценарий поскольку он требует редактирования базы знаний в IDE, а не визуальном редакторе и такой редактор надо делать (что не так сложно с помощью генеративных LLM). #thoughts #knowledge

Repost from Ivan Begtin
Я [не так уж] недавно озадачился темой баз знаний и баз документов для работы с ИИ да и без него тоже и не то чтобы в восторге от того что есть в практическом использовании. Если посмотреть на то как об этом думают другие, например, Andrey Karpathy в его тексте LLM Knowledge Bases то там речь про связку Obsidian как личный инструмент редактирования и набор инструментов по поиску и обогащению материалов с помощью LLM. Вот эта модель, когда в ядре используются связанные Markdown файлы, а способы редактирования могут быть разные, Obsidian один из наиболее популярных, но далеко не единственный. Способ работающий, до каких то пределов и для подготовки сжатых смысловых связанных блоков. Какие есть еще варианты связок редактор/интерфейс, LLM и тд. ? Самый очевидный воспользоваться каким-нибудь Notion где AI встроен можно сказать естественным образом. Есть еще OpenKB на базе PageIndex в котором вообще нет UI интерфейса, но есть возможность делать запросы с командной строки. Веб интерфейс это не проблема, можно поднять один из Markdown wiki продуктов вроде Docusaurus, но сам подход выглядит так: добавляешь документ в любом формате -> он преобразуется в Markdown -> Markdown индексируется в базу знаний - > можно задавать вопросы естественным языком. Карпатый в своих рассуждениях еще упоминал qmd любопытный тул как раз для такой базы знаний. Я про все это тоже думаю, сразу в контексте 3-х близких задач: 1. Личная база знаний, которая у меня как и у многих на базе Obsidian и к которой хотелись бы LLM возможности что называется из коробки, а не через разные *Claw. 2. База знаний для работы доменных экспертов когда есть пул специалистов в предметной области и они готовят материалы для обучения LLM под предметную область какой бы она ни была (кулинария, юриспруденция, поэззия и тд). Тут идеально если есть Вики инструмент, на том же Markdown'е. И в который раз можно лишь посетовать про дефицит структурированных вики, хотя есть тот же Outline. 3. Хранилище документов под очень большие объёмы, условно в миллионы документов, с тем что документы могут быть разного типа с разными профилями метаданных и также подключаемыми. У этого есть разные решения, от технических, все метаданные в индекс OpenSearch, а профили описывать в разными схемами в YAML, до концептуальных через создание онтологии и использование институциональных репозиториев вроде Hyrax, DSpace, Islandora и тд. Институциональные репозитории и библиотечные системы далеки очень от инженерных паттернов и не факт что это лучшее решение. Может показаться что эти задачи отличаются, но вот мне представляется что они очень близки. #thoughts #ai #documents

Repost from Ivan Begtin
Разные мысли вслух: - инструменты мониторинга потребления токенов и запросов к LLM становятся всё более актуальными. Что-то вроде deepeval или phoenix и других. Характерно, что в мире такие решения существуют и интегрированы со всеми основными сервисами, а российские сервисы типа Яндекса и Сбера исключены из мировой экосистемы. Это отдельная тема для размышлений: изменится ли это как-либо или нет. - единственные по-настоящему успешные бизнесы, связанные с открытыми данными, не являются бизнесами на самих открытых данных, а бизнесами на инфраструктуре вокруг них. Hugging Face сейчас крупнейший хостинг данных для обучения ИИ, но это не бизнес на открытых данных, хотя портал и наполнен ими. Другой пример — Esri. Я наблюдаю, как всё больше городских порталов данных и геоданных создаются на их платформе, но бизнес Esri не в них, а в том, что создатели порталов используют их сервисы, а портал по открытости данных/геоданных создают в довесок. #opendata #ai #thoughts

fff — самый быстрый поиск файлов для ИИ-агентов, Neovim, Rust и Node.js Поиск файлов звучит как нерешённая задача уровня «най
fff — самый быстрый поиск файлов для ИИ-агентов, Neovim, Rust и Node.js Поиск файлов звучит как нерешённая задача уровня «найди папку Downloads». Но у кодинг-агентов это один из самых проблемных примитивов: прежде чем что-то изменить в репозитории, агент должен найти нужный файл — и чем хуже работает этот шаг, тем больше ошибок дальше по цепочке. fff решает именно это: нативные привязки для Rust, C и Node.js, готовая интеграция с Neovim и отдельная оптимизация под сценарии ИИ-агентов. Авторы позиционируют его как самый быстрый и точный файловый поиск — и почти 6 тысяч звёзд на GitHub говорят, что в это охотно верят. Как устроен тулкит — в репозитории на GitHub. @tproger Читайте также в VK, Max и Дзен

Стандартный ИИ-агент помнит только текущий разговор. Закрыл терминал и всё: твои предпочтения, прошлые решения, контекст проекта испарились. Следующий запуск начинается с нуля. Это как если бы программист каждое утро забывал, в какой он команде и на каком языке пишет. Есть, конечно, системы запоминаний, по сути просто записывание в файл, когда модель считает, что эту инфу важно не потерять. Но это всё полумеры, тем более что есть прям целые отдельные системы памяти. Расскажу про основные. iai-mcp — локальный сервер памяти для Claude Code. Работает на локальной машине, шифрует данные, не лезет в облако. Память устроена как граф. Свежий проект, буквально пару дней от релиза, но автор заявляет, что по бенчмаркам обгоняет топовый mempalace. MemPalace — память по принципу античной техники локусов. Иерархия: крылья (проекты), комнаты (темы), залы (типы связей), ящики (дословные записи). Сохраняет текст целиком, не перефразирует. Гибридный поиск: BM25 + косинус + граф знаний. 96,6% на LongMemEval. Mem0 — проект, который показался мне самым зрелым, куча звёзд и разработчиков и даже $24M инвестиций. Векторный поиск + граф знаний + key-value. Dual-deployment: open-source (Apache 2.0, Docker) или облако. Но графовая память за paywall. Эксклюзивный провайдер памяти для AWS Agent SDK. Supermemory — лидер по бенчмаркам. Впрочем, каждый проект про себя так заявляет, а единой методики нет, все чуть под себя подстривают. 81,6–85,2% на LongMemEval. Гибридный RAG: память + документы в одном запросе. Есть коннекторы к Google Drive, Gmail, Notion, GitHub. Но ядро закрытое, self-hosting только по enterprise-контракту. Zep — временные графы знаний. Каждый факт хранит 4 временные метки: когда узнали, когда стало актуально, когда перестало. Можно спросить «а где Алиса работала в марте 2025?» и получить правильный ответ, даже если она уже уволилась. Ядро Graphiti open-source. Hindsight — память, построенная как человеческая. Четыре сети: факты о мире, собственный опыт, синтезированные наблюдения, развивающиеся убеждения. Четыре параллельные стратегии поиска + reranking. Рекорд на LongMemEval — 91,4%. MIT, нет paywall, всё открыто. Mastra — фреймворк для агентов, где память встроена изначально. Для тех, кто строит агентов с нуля и не хочет склеивать десяток библиотек. Open-source. Что-то одно посоветовать не могу, сам не планирую сравнивать, но думаю начать с iai-mcp, по описанию понравился. @neuro_channel (теперь ещё в VK и Max)