Machinelearning
Погружаемся в машинное обучение и Data Science Показываем как запускать любые LLm на пальцах. По всем вопросам - @haarrp @itchannels_telegram -🔥best channels Реестр РКН: clck.ru/3Fmqri
显示更多📈 Telegram 频道 Machinelearning 的分析概览
频道 Machinelearning (@ai_machinelearning_big_data) 俄语 语言赛道中的 是活跃参与者。目前社区聚集了 295 712 名订阅者,在 技术与应用 类别中位列第 332,并在 俄罗斯 地区排名第 1 273 位。
📊 受众指标与增长动态
自 невідомо 创建以来,项目保持高速增长,吸引了 295 712 名订阅者。
根据 23 六月, 2026 的最新数据,频道保持稳定运转。过去 30 天订阅人数变化为 -6 330,过去 24 小时变化为 -217,整体触达仍然可观。
- 认证状态: 未认证
- 互动率 (ER): 平均受众互动率为 7.94%。内容发布后 24 小时内通常能获得 5.68% 的反应,占订阅者总量。
- 帖子覆盖: 每篇帖子平均可获得 23 490 次浏览,首日通常累积 16 791 次浏览。
- 互动与反馈: 受众积极参与,单帖平均反应数为 190。
- 主题关注点: 内容集中在 openai, claude, api, gemini, контекст 等核心主题上。
📝 描述与内容策略
作者将该频道定位为表达主观观点的平台:
“Погружаемся в машинное обучение и Data Science
Показываем как запускать любые LLm на пальцах.
По всем вопросам - @haarrp
@itchannels_telegram -🔥best channels
Реестр РКН: clck.ru/3Fmqri”
凭借高频更新(最新数据采集于 24 六月, 2026),频道始终保持新鲜度与高覆盖。分析显示受众积极互动,使其成为 技术与应用 类别中的关键影响点。
# Установка из pip
pip install guidellm
# Запуск модели в vLLM
vllm serve "neuralmagic/Meta-Llama-3.1-8B-Instruct-quantized.w4a16"
# Запуск GuideLLM
guidellm \
--target "http://localhost:8000/v1" \
--model "neuralmagic/Meta-Llama-3.1-8B-Instruct-quantized.w4a16" \
--data-type emulated \
--data "prompt_tokens=512,generated_tokens=128"
По умолчанию, GuideLLM проводит серию оценок производительности с разной частотой запросов, каждая из которых длится 120 секунд, и результаты выводятся в терминал.
После завершения оценки GuideLLM подведет итоги, в том числе - метрики эффективности.
✔️ Опции CLI и среды для настройки метрик:
🟠продолжительность выполнения каждого бенчмарка;
🟠количество одновременных запросов;
🟠частота запросов;
🟠тип выполнения оценки,
🟠выбор источника данных для оценки;
Документация к находится в стадии разработки. Полный набор опций запуска и конфигурирования GuideLLM можно посмотреть командами
guidellm --help и guidellm-config
📌Лицензирование : Apache 2.0 License.
🖥Github [ Stars: 33 | Issues: 2 | Forks: 1]
@ai_machinelearning_big_data
#AI #Guidellm #MLTool #LLM #Benchmark🟠AutoGen Studio не предназначен для использования в качестве готового к продакшену приложения. Это среда прототипирования и разработки процессов и агентов. 🟠AutoGen Studio находится в стадии активной разработки с частыми итерациями коммитов. Документация проекта обновляется синхронно с кодом. 🟠Системные требования к установке: Python 3.10+ и Node.js => 14.15.0.📌Лицензирование : CC-BY-NC-SA-4.0 License & MIT License 🟡Страница проекта 🟡Документация 🟡Arxiv 🟡Сообщество в Discord 🖥Github [ Stars: 30.2K | Issues: 493 | Forks: 4.4K] @ai_machinelearning_big_data #AI #AgentsWorkflow #MLTool #Microsoft #LLM
Embedding модели позволяют преобразовать текстовые данные в плотные векторные представления, которые используются для задач NLP. На практике embedding модели используются для векторизации исходного текста, например корпоративной информации, которой нет в основной LLM, и использования его для построения RAG-системОтличия NV-Embed-v2 от NV-Embed-v1: 🟢использование LLM для обработки латентных векторов; 🟢двухэтапный инструктивный метод настройки; 🟢новые методы анализа отрицательных результатов, которые учитывают положительный показатель релевантности для лучшего удаления ложноотрицательных результатов. Характеристики модели: 🟠Base Decoder-only LLM: Mistral-7B-v0.1 🟠Pooling Type: Latent-Attention 🟠Embedding Dimension: 4096 🟠Vocab size: 32000 ⚠️ Важно! 🟢Версии пакетов для локального запуска :
torch=2.2.0, transformers=4.42.4, flash-attn=2.2.0, sentence-transformers=2.7.0;
🟢Для доступа к nvidia/NV-Embed-v2 необходимо пройти аутентификацию на HF, используйте свой токен HF в huggingface-cli login.
▶️ Пример использования с HF Transformers:
import torch
import torch.nn.functional as F
from transformers import AutoTokenizer, AutoModel
# Each query needs to be accompanied by an corresponding instruction describing the task
task_name_to_instruct = {"example": "Given a question, retrieve passages that answer the question",}
query_prefix = "Instruct: "+task_name_to_instruct["example"]+"\nQuery: "
queries = [
'are judo throws allowed in wrestling?',
'how to become a radiology technician?'
]
# No instruction needed for retrieval passages
passage_prefix = ""
passages = [
"** LLM Answer about judo **",
"** LLM Answer about radiology **"
]
# load model with tokenizer
model = AutoModel.from_pretrained('nvidia/NV-Embed-v2', trust_remote_code=True)
# get the embeddings
max_length = 4096
query_embeddings = model.encode(queries, instruction=query_prefix, max_length=max_length)
passage_embeddings = model.encode(passages, instruction=passage_prefix, max_length=max_length)
# normalize embeddings
query_embeddings = F.normalize(query_embeddings, p=2, dim=1)
passage_embeddings = F.normalize(passage_embeddings, p=2, dim=1)
# get the embeddings with DataLoader
scores = (query_embeddings @ passage_embeddings.T) * 100
print(scores.tolist())
📌Лицензирование : CC-BY-NC-SA-4.0 License.
🟡Модель
🟡Arxiv
@ai_machinelearning_big_data
#AI #Embedding #ML #NVIDIA #LLM# Create Conda venv:
conda create -n adas python=3.11
# Activate venv:
conda activate adas
#Install Dependencies:
pip install -r requirements.txt
# Set OpenAI API Key:
export OPENAI_API_KEY="YOUR KEY HERE"
Запуск Meta Agent Search на примере области поиска "arc":
# Navigate to _arc folder:
cd _arc
# Run Meta Agent Search
python search.py
📌Лицензирование : Apache 2.0 license
🟡Страница проекта
🟡Arxiv
🖥Github [ Stars: 484 | Issues: 4 | Forks: 53]
@ai_machinelearning_big_data
#AI #LLM #Agents #ML #ChatGPT
# Create venv
conda create -n skillmimic python=3.8
conda activate skillmimic
pip install -r requirements.txt
# Install the Issac Gym
tar -xzvf /{your_source_dir}/IsaacGym_Preview_4_Package.tar.gz -C /{your_target_dir}/
cd /{your_target_dir}/isaacgym/python/
pip install -e .
▶️Инференс с использованием политики:
python skillmimic/run.py --test --task SkillMimicBallPlay --num_envs 16 \
--cfg_env skillmimic/data/cfg/skillmimic.yaml \
--motion_file skillmimic/data/motions/BallPlay-M/layup \
--checkpoint skillmimic/data/models/mixedskills/nn/skillmimic_llc.pth
# Transform the images into a video
python skillmimic/utils/make_video.py --image_path skillmimic/data/images/test_images --fps 60
📌Лицензирование : Apache 2.0 License.
▪Страница проекта
▪Набор моделей
▪Arxiv
▪Demo Video
▪Github [ Stars: 38 | Issues: 0 | Forks: 1]
@ai_machinelearning_big_data
#AI #SkillMimic #ML #HOI# Clone repository with submodules
git clone --recursive https://github.com/ziyc/drivestudio.git
cd drivestudio
# Create venv and install requirements
conda create -n drivestudio python=3.9 -y
conda activate drivestudio
pip install -r requirements.txt
pip install git+https://github.com/facebookresearch/pytorch3d.git
pip install git+https://github.com/NVlabs/nvdiffrast
# Set up for SMPL Gaussians
cd third_party/smplx/
pip install -e .
cd ../..
📌Лицензирование : MIT License.
🟡Страница проекта
🟡Arxiv
🖥Github [ Stars: 117 | Issues: 1 | Forks: 7]
@ai_machinelearning_big_data
#AI #DriveStudio #ML #OmiRe #Gaussian# Clone repository
git clone https://github.com/NVlabs/EAGLE.git
cd Eagle
# Create venv and install requirements
conda create -n eagle python=3.10 -y
conda activate eagle
pip install --upgrade pip # enable PEP 660 support
pip install requirements
# Run Gradio
python gradio_demo.py --model-path ${MODEL_CKPT} --conv-mode vicuna_v1
📌Лицензирование кода : Apache 2.0 License.
📌Лицензирование моделей: CC-BY-NC-SA-4.0 License.
🟡Набор моделей
🟡Arxiv
🟡Demo
🖥Github [ Stars: 56 | Issues: 1 | Forks: 3]
@ai_machinelearning_big_data
#AI #NVIDIA #ML #EAGLEX5 #MMLM# Clone repositiry
git clone https://github.com/Zyphra/transformers_zamba2.git
#Install requirments:
cd transformers_zamba2
pip install -e .
pip install accelerate
#Inference
from transformers import AutoTokenizer, AutoModelForCausalLM
import torch
tokenizer = AutoTokenizer.from_pretrained("Zyphra/Zamba2-1.2B")
model = AutoModelForCausalLM.from_pretrained("Zyphra/Zamba2-1.2B", device_map="cuda", torch_dtype=torch.bfloat16)
input_text = "A funny prompt would be "
input_ids = tokenizer(input_text, return_tensors="pt").to("cuda")
outputs = model.generate(**input_ids, max_new_tokens=100)
print(tokenizer.decode(outputs[0]))
▶️Для запуске на CPU - only, укажите use_mamba_kernels=False при загрузке модели с помощью AutoModelForCausalLM.from_pretrained.
📌Лицензирование : Apache 2.0 License.
🟡Страница проекта
🟡Arxiv
🟡Модель
@ai_machinelearning_big_data
#AI #SLM #Mamba #ML #Zamba2mini
现已上线!2025 年 Telegram 研究 — 年度关键洞察 
