cookie

Мы используем файлы cookie для улучшения сервиса. Нажав кнопку «Принять все», вы соглашаетесь с использованием cookies.

avatar

Big Data AI

@workakkk - админ Вопросы с собеседований по Machine Learning, Data Science, Deep Learning и Нейроннным сетям @data_analysis_ml - анализ данных @ai_machinelearning_big_data @itchannels_telegram - важное для программиста

Больше
Рекламные посты
12 986
Подписчики
+3124 часа
+2297 дней
+80330 дней

Загрузка данных...

Прирост подписчиков

Загрузка данных...

🌟 MInference 1.0 — метод ускорения обработки промпта для LLM с большим контекстом
git clone https://huggingface.co/spaces/microsoft/MInference
cd MInference
pip install -r requirments.txt
pip install flash_attn pycuda==2023.1
python app.py
Вычислительные проблемы, связанные с выводом данных с помощью LLM, остаются большим препятствием для их широкого применения; вычислительная сложность растёт с увеличением длины подсказок. Из-за квадратичной сложности вычислений для обработки промпта из 1 млн лексем на одном GPU A100 для 8B LLM требуется 30 минут. Поэтому Microsoft выкатили MInference, которая позволяет ускорить обработку большого промпта до 10 раз, причём с сохранением точности LLM 🖥 GitHub 🤗 Демо на HF 🟡 Arxiv @ai_machinelearning_big_data
Показать все...
339786302-52613efc-738f-4081-8367-7123c81d6b19.mp44.45 MB
🔥 5👍 2 2
⚡️ Яндекс рассказал о принципах работы одного из крупнейших рекомендательных сервисов «Баннерная крутилка» умеет переживать 700 тысяч RPS, а иногда и больше. При каждом запросе сервис просматривает базу из миллиарда документов и выбирает наиболее релевантные. Обработка запроса занимает менее 200 миллисекунд. Тем. кто строит рекомендательные системы, будет любопытно узнать, какими принципами руководствуется Яндекс при построении подобных высоконагруженных систем, как устроены стадии отбора документов и какое участие в ранжировании принимает ML. https://habr.com/ru/companies/yandex/articles/816205/
Показать все...
Как устроен рекомендательный сервис, который выдерживает 700 тысяч запросов в секунду. Доклад Яндекса

«Баннерная крутилка» — один из самых высоконагруженных сервисов в Яндексе. Он умеет переживать 700 тысяч RPS, а иногда и больше. Каждый раз, когда приходит запрос, крутилка...

1
💻Вышла СУБД MySQL 9.0.0 На днях Oracle выпустила СУБД MySQL 9.0.0. Разработчики проекта подготовили и выложили в открытый доступ сборки MySQL Community Server 9.0.0 для основных дистрибутивов Linux, FreeBSD, macOS и Windows. В 2023 году Oracle объявила об изменении модели формирования релизов СУБД MySQL. Разработчики начали выпускать два вида веток MySQL: Innovation (новые функции, частое обновление, три месяца поддержки) и LTS (с расширенным временем поддержки и сохранением неизменного поведения). Проект MySQL 9.0 отнесён к ветке Innovation, к которым также будут отнесены следующие значительные релизы MySQL 9.1 и 9.2. Дистрибутивы на базе Innovation-веток рекомендованы для тех пользователей, кто хочет раньше получать доступ к новой функциональности. Они публикуются каждые 3 месяца и поддерживаются только до публикации следующего значительного релиза (например, после появления ветки 9.1 будет прекращена поддержка ветки 9.0). @sqlhub
Показать все...
👍 2 1🔥 1
ChatGPT Just Learned To Fix Itself! https://www.youtube.com/watch?v=cw9jcjpufBI @bigdatai
Показать все...
ChatGPT Just Learned To Fix Itself!

❤️ Check out Lambda here and sign up for their GPU Cloud:

https://lambdalabs.com/paper

Our Patreon with early access:

https://www.patreon.com/TwoMinutePapers

📝 The paper "LLM Critics Help Catch LLM Bugs" is available here:

https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

📝 My paper on simulations that look almost like reality is available for free here:

https://rdcu.be/cWPfD

Or this is the orig. Nature Physics link with clickable citations:

https://www.nature.com/articles/s41567-022-01788-5

🙏 We would like to thank our generous Patreon supporters who make Two Minute Papers possible: Alex Balfanz, Alex Haro, B Shang, Benji Rabhan, Gaston Ingaramo, Gordon Child, John Le, Kyle Davis, Loyal Alchemist, Lukas Biewald, Martin, Michael Albrecht, Michael Tedder, Owen Skarpness, Richard Sundvall, Taras Bobrovytsky, Ted Johnson, Thomas Krcmar, Tybie Fitzhugh, Ueli Gallizzi. Thumbnail background design: Felícia Zsolnai-Fehér - http://felicia.hu Károly Zsolnai-Fehér's research works:

https://cg.tuwien.ac.at/~zsolnai/

Twitter:

https://twitter.com/twominutepapers

#ChatGPT

👍 1 1🔥 1
Куда пойти, чтобы подготовиться к вступительным испытаниям в магистратуру? Факультет компьютерных наук и Нетология организуют совместный марафон по подготовке к вступительным экзаменам в онлайн-магистратуру по инженерии данных. Марафон включает: ⏺️3 вебинара по основам математики, алгоритмов и программировании на Python ⏺️консультацию по поступлению в онлайн-магистратуру «Инженерия данных» ⏺️экспертную поддержку 💻 Формат: онлайн 📆 Когда: 2-10 июля 🐭Для участия необходимо зарегистрироваться по ссылке. Реклама ЗАО ГК Аккорд 2SDnjcJts1L
Показать все...
👍 1
Фото недоступноПоказать в Telegram
💻YugabyteDB — высокопроизводительная распределенная БД, которая поддерживает все возможности PostgreSQL YugabyteDB отлично подходит для облачных OLTP-приложений (т. е. работающих в реальном времени и критически важных для бизнеса), которым необходима абсолютная корректность данных и требуется масштабируемость или высокая устойчивость к сбоям. Быстрое создание локального кластера YugabyteDB с Docker:
docker run -d --name yugabyte -p7000:7000 -p9000:9000 -p15433:15433 -p5433:5433 -p9042:9042 \
 yugabytedb/yugabyte:2.21.1.0-b271 bin/yugabyted start \
 --background=false
🖥 GitHub 🟡 Доки @sqlhub
Показать все...
👍 1 1🔥 1
Фото недоступноПоказать в Telegram
⚡️ Scaling Synthetic Data Creation with 1,000,000,000 Persons - Представлена коллекция из 1 миллиарда различных персонажей, автоматически отобранных на основе веб-данных - Значительный прирост на MATH: 49,6 ->64,9 репозиторий: https://github.com/tencent-ailab/persona-hub abs: https://arxiv.org/abs/2406.20094 @bigdatai
Показать все...
1🔥 1
Фото недоступноПоказать в Telegram
СКУЧНО. ТАК БОЛЬШЕ НЕЛЬЗЯ! — подумала наша команда летом и создала новое реалити-шоу о Data-инженерах 🤯 «‎Где Data, Коль?» — это: ▶️5 разных участников из мира Big Data, прошедшие отбор; ▶️ментор — Николай Марков, Data Platform Lead в компании Altenar; ▶️участники строят пайплайны, осваивают Hadoop, Spark, Airflow и другие инструменты; ▶️реальный проект на собственных данных; ▶️секретное испытание в финале. ❗️Кто станет фаворитом зрителей? Кто дойдет до финала и получит заветный оффер?! 🔈Ссылка на первую серию уже в Telegram-канале «‎Где Data, Коль?» Вторая серия выйдет 5 июля. Подписывайся, чтобы не пропустить! Реклама ООО «Слёрм» ИНН 3652901451 erid: 2Vtzqx8PuYU
Показать все...
🤡 4👍 2 1👀 1
Фото недоступноПоказать в Telegram
⚡️ Microsoft запустила новый курс по генеративному ИИ! Бесплатный курс из 18 уроков доступен на Github и научит вас всему, что вам нужно знать, чтобы начать создавать приложения с генеративным ИИ ▪ Github @bigdatai
Показать все...
12🔥 3👍 2
💻 memgraph — графовая БД с открытым исходным кодом, предназначенная для динамических аналитических средcurl https://install.memgraph.com | sh Memgraph — это open-source БД, созданная для потоковой передачи данных в реальном времени и совместимая с Neo4j. Memgraph особенно актуальна для тех, кто изучает взаимосвязанные данные, которые можно представить в виде графа Memgraph может напрямую подключиться к потоковой инфраструктуре и может получать данные из таких источников, как Kafka, SQL или обычные CSV-файлы. Memgraph реализована на C/C++ и использует архитектуру in-memory first, чтобы гарантировать постоянную максимальную производительность и отсутствие сюрпризов. Соответствует требованиям ACID и обладает высокой доступностью. 🖥 GitHub 🟡 Доки @bigdatai
Показать все...
👍 2 1🔥 1
Выберите другой тариф

Ваш текущий тарифный план позволяет посмотреть аналитику только 5 каналов. Чтобы получить больше, выберите другой план.