Код в мешке
Ir al canal en Telegram
Код в мешке - про кодинг, и не только... Это личная записная книжка https://t.me/joinchat/AAAAAEIy6oGlr8oxqTMS5w
Mostrar más250
Suscriptores
Sin datos24 horas
-17 días
-530 días
Archivo de publicaciones
250
Иллюзия анонимности: почему Telegram Wallet не спасет от контроля ФНС #habr
https://habr.com/ru/articles/1033286/
Tags: криптовалюты, криптобиржи, фнс, росфинмониторинг, регулятор, налоги, банки, telegram, wallet
Author: strannik96
250
Почему текст от LLM узнаётся за пять секунд: разбираю стилистические маркеры через архитектуру моделей #habr
https://habr.com/ru/articles/1033450/
Tags: LLM, GPT, Claude, sampling, temperature, prompt engineering, постобработка, детекция ИИ-текста, RLHF
Author: nlaik
250
Веселимся со Spring: pet-проект по распознаванию речи #habr
https://habr.com/ru/articles/1033338/
Tags: Java, Spring Framework, Vosk, speech recognition, распознавание речи, REST API, WAV, Java Sound API, pet project, веселье
Author: rurikovich
250
Эра личных секретарей #habr
https://habr.com/ru/articles/1033442/
Tags: ai, llm, ии, ии-ассистент, ии помощник
Author: amcured
250
Как я спроектировал систему защиты от протечек воды, или аккумулятор с транзистором побеждают бога морей #habr
https://habr.com/ru/articles/1033438/
Tags: diy, multisim, proteus, печатные платы, защита от протечек
Author: lukon
250
Почему российский бизнес проигрывает битву за информацию и как это исправить. Часть 2 #habr
https://habr.com/ru/articles/1033430/
Tags: качество данных, scd, slowly changing dimensions, темпоральность, миграция данных, sap, импортозамещение, etl, sql, системный анализ
Author: vasyukovevgeny
250
Нейросеть для презентаций: ТОП-10 ИИ инструментов как сделать презентацию бесплатно #habr
https://habr.com/ru/companies/ranvik/articles/1033316/
Tags: ии, презентация, gemini, gpt, midjourney, claude, нейросети, grok, nano banana, flux
Author: VisionSoul (Ranvik)
250
Полный гайд по dunder-методам в Python (от новичка до профи) #habr
https://habr.com/ru/articles/1033432/
Tags: ython, ООП, dunder-методы, магические методы, метапрограммирование, дескрипторы, итераторы, генераторы, контекстные менеджеры, Python 3
Author: enamored_poc
250
Из настроек Chrome пропало сообщение о приватности локального ИИ Gemini Nano. Это может стоить Google миллиарды #habr
https://habr.com/ru/news/1033392/
Tags: Google, Chrome, Gemini Nano
250
Исковая давность по дебиторской задолженности: как считать, не пропустить и использовать в свою пользу #habr
https://habr.com/ru/articles/1032330/
Tags: срок исковой давности дебиторка, взыскание дебиторской задолж, пропуск срока исковой давн, прерывание исковой давности, приостановление исковой давн, дебиторская задолж взыскание, срок взыскания долга, арбитражный суд дебиторка, списание дебиторской задолж
Author: ddconsult
250
Ваш Telegram-бот на базе LLM уязвим. Я написал сканер, чтобы доказать это на популярном Open Source проекте #habr
https://habr.com/ru/articles/1033420/
Tags: llm, red teaming, информационная безопасность, prompt injection, telegram-боты
Author: Peternsk
250
Claude Code — полный гайд и обучение для новичков с нуля #habr
https://habr.com/ru/articles/1033416/
Tags: claude, ии, claude-code, искусственный интеллект
Author: claudedev
250
Как навсегда побороть лишний вес и прийти в хорошую физическую форму #habr
https://habr.com/ru/articles/1033406/
Tags: здоровый образ жизни, изменения
Author: Terentew
250
Цифровой аудит против галлюцинаций по ГОСТу. Как понять, когда ответу ИИ нельзя верить? #habr
https://habr.com/ru/articles/1033404/
Tags: ИИ, LLM, интерпретация ИИ, аудит ИИ, сравнение моделей, ChatCPT, Gemini, принятие решений
Author: alislille
250
Не покупайте плохой VPN #habr
https://habr.com/ru/articles/1033400/
Tags: vpn
Author: Namilsky
250
Repost from Ivan Begtin
Почему я задумался про LLM Knowledge base и работу с базами знаний через LLM? У меня есть какое-то, немало количество материалов собранных из большого числа небольших записок и недописанных книг. Эти книги, изначально в формате лонгридов и страниц для Gitbook'а можно назвать существенными кусками (ядром) того что можно назвать доменной базой знаний, в понимании домена как очерченной предметной области.
У меня таких областей было и есть несколько и вот сейчас без применения ИИ ассистентов работать с ними очень сложно. И из реально работающих инструментов реально наиболее оптимален Notion, но со всеми оговорками зависимости от его проприетарности.
Идеальный инструмент - это продукт работающий локально на компьютере или в локальной сети, позволяющий вносить знания по предпопределенным профилям и шаблонам, с визуальным редактированием и совместной работы от 5 редакторов. Самое очевидное тут Mediawiki/Wikibase, с оговоркой что там внутри не Markdown, что там очень консервативное API и интеграции, и с не менее консервативными инструментами метаописания и редактирования.
Тут я вспомнил что есть и другой путь. Переводить все документы в YAML и формировать их структурированными блоками. YAML/TOML файлы значительно проще редактировать сохраняя структурную целостность, заполняя метаданными и так далее, а конвертация в Markdown может быть автоматической/автоматизированной.
Это неидеальный сценарий поскольку он требует редактирования базы знаний в IDE, а не визуальном редакторе и такой редактор надо делать (что не так сложно с помощью генеративных LLM).
#thoughts #knowledge
250
Repost from Ivan Begtin
Я [не так уж] недавно озадачился темой баз знаний и баз документов для работы с ИИ да и без него тоже и не то чтобы в восторге от того что есть в практическом использовании. Если посмотреть на то как об этом думают другие, например, Andrey Karpathy в его тексте LLM Knowledge Bases то там речь про связку Obsidian как личный инструмент редактирования и набор инструментов по поиску и обогащению материалов с помощью LLM.
Вот эта модель, когда в ядре используются связанные Markdown файлы, а способы редактирования могут быть разные, Obsidian один из наиболее популярных, но далеко не единственный. Способ работающий, до каких то пределов и для подготовки сжатых смысловых связанных блоков.
Какие есть еще варианты связок редактор/интерфейс, LLM и тд. ?
Самый очевидный воспользоваться каким-нибудь Notion где AI встроен можно сказать естественным образом.
Есть еще OpenKB на базе PageIndex в котором вообще нет UI интерфейса, но есть возможность делать запросы с командной строки. Веб интерфейс это не проблема, можно поднять один из Markdown wiki продуктов вроде Docusaurus, но сам подход выглядит так:
добавляешь документ в любом формате -> он преобразуется в Markdown -> Markdown индексируется в базу знаний - > можно задавать вопросы естественным языком.
Карпатый в своих рассуждениях еще упоминал qmd любопытный тул как раз для такой базы знаний.
Я про все это тоже думаю, сразу в контексте 3-х близких задач:
1. Личная база знаний, которая у меня как и у многих на базе Obsidian и к которой хотелись бы LLM возможности что называется из коробки, а не через разные *Claw.
2. База знаний для работы доменных экспертов когда есть пул специалистов в предметной области и они готовят материалы для обучения LLM под предметную область какой бы она ни была (кулинария, юриспруденция, поэззия и тд). Тут идеально если есть Вики инструмент, на том же Markdown'е. И в который раз можно лишь посетовать про дефицит структурированных вики, хотя есть тот же Outline.
3. Хранилище документов под очень большие объёмы, условно в миллионы документов, с тем что документы могут быть разного типа с разными профилями метаданных и также подключаемыми. У этого есть разные решения, от технических, все метаданные в индекс OpenSearch, а профили описывать в разными схемами в YAML, до концептуальных через создание онтологии и использование институциональных репозиториев вроде Hyrax, DSpace, Islandora и тд. Институциональные репозитории и библиотечные системы далеки очень от инженерных паттернов и не факт что это лучшее решение.
Может показаться что эти задачи отличаются, но вот мне представляется что они очень близки.
#thoughts #ai #documents
250
Repost from Ivan Begtin
Разные мысли вслух:
- инструменты мониторинга потребления токенов и запросов к LLM становятся всё более актуальными. Что-то вроде deepeval или phoenix и других. Характерно, что в мире такие решения существуют и интегрированы со всеми основными сервисами, а российские сервисы типа Яндекса и Сбера исключены из мировой экосистемы. Это отдельная тема для размышлений: изменится ли это как-либо или нет.
- единственные по-настоящему успешные бизнесы, связанные с открытыми данными, не являются бизнесами на самих открытых данных, а бизнесами на инфраструктуре вокруг них. Hugging Face сейчас крупнейший хостинг данных для обучения ИИ, но это не бизнес на открытых данных, хотя портал и наполнен ими. Другой пример — Esri. Я наблюдаю, как всё больше городских порталов данных и геоданных создаются на их платформе, но бизнес Esri не в них, а в том, что создатели порталов используют их сервисы, а портал по открытости данных/геоданных создают в довесок.
#opendata #ai #thoughts
250
Repost from Типичный программист
fff — самый быстрый поиск файлов для ИИ-агентов, Neovim, Rust и Node.js
Поиск файлов звучит как нерешённая задача уровня «найди папку Downloads». Но у кодинг-агентов это один из самых проблемных примитивов: прежде чем что-то изменить в репозитории, агент должен найти нужный файл — и чем хуже работает этот шаг, тем больше ошибок дальше по цепочке.
fff решает именно это: нативные привязки для Rust, C и Node.js, готовая интеграция с Neovim и отдельная оптимизация под сценарии ИИ-агентов. Авторы позиционируют его как самый быстрый и точный файловый поиск — и почти 6 тысяч звёзд на GitHub говорят, что в это охотно верят.
Как устроен тулкит — в репозитории на GitHub.
@tproger
Читайте также в VK, Max и Дзен
250
Repost from Нейроканал
Стандартный ИИ-агент помнит только текущий разговор. Закрыл терминал и всё: твои предпочтения, прошлые решения, контекст проекта испарились. Следующий запуск начинается с нуля. Это как если бы программист каждое утро забывал, в какой он команде и на каком языке пишет.
Есть, конечно, системы запоминаний, по сути просто записывание в файл, когда модель считает, что эту инфу важно не потерять. Но это всё полумеры, тем более что есть прям целые отдельные системы памяти. Расскажу про основные.
iai-mcp — локальный сервер памяти для Claude Code. Работает на локальной машине, шифрует данные, не лезет в облако. Память устроена как граф. Свежий проект, буквально пару дней от релиза, но автор заявляет, что по бенчмаркам обгоняет топовый mempalace.
MemPalace — память по принципу античной техники локусов. Иерархия: крылья (проекты), комнаты (темы), залы (типы связей), ящики (дословные записи). Сохраняет текст целиком, не перефразирует. Гибридный поиск: BM25 + косинус + граф знаний. 96,6% на LongMemEval.
Mem0 — проект, который показался мне самым зрелым, куча звёзд и разработчиков и даже $24M инвестиций. Векторный поиск + граф знаний + key-value. Dual-deployment: open-source (Apache 2.0, Docker) или облако. Но графовая память за paywall. Эксклюзивный провайдер памяти для AWS Agent SDK.
Supermemory — лидер по бенчмаркам. Впрочем, каждый проект про себя так заявляет, а единой методики нет, все чуть под себя подстривают. 81,6–85,2% на LongMemEval. Гибридный RAG: память + документы в одном запросе. Есть коннекторы к Google Drive, Gmail, Notion, GitHub. Но ядро закрытое, self-hosting только по enterprise-контракту.
Zep — временные графы знаний. Каждый факт хранит 4 временные метки: когда узнали, когда стало актуально, когда перестало. Можно спросить «а где Алиса работала в марте 2025?» и получить правильный ответ, даже если она уже уволилась. Ядро Graphiti open-source.
Hindsight — память, построенная как человеческая. Четыре сети: факты о мире, собственный опыт, синтезированные наблюдения, развивающиеся убеждения. Четыре параллельные стратегии поиска + reranking. Рекорд на LongMemEval — 91,4%. MIT, нет paywall, всё открыто.
Mastra — фреймворк для агентов, где память встроена изначально. Для тех, кто строит агентов с нуля и не хочет склеивать десяток библиотек. Open-source.
Что-то одно посоветовать не могу, сам не планирую сравнивать, но думаю начать с iai-mcp, по описанию понравился.
@neuro_channel (теперь ещё в VK и Max)
¡Ya disponible! Investigación de Telegram 2025 — los principales insights del año 
