ordinary subinium

الذهاب إلى القناة على Telegram

진짜가 되고 싶은. 채팅방: https://t.me/web3subinchat * 모든 의견은 개인 의견이며, 제가 속한 회사, 조직 등을 대변하지 않습니다. 모든 내용은 특정 자산에 대한 경제적 조언이 아니며, 이에 대해 책임지지 않습니다.

إظهار المزيد

Korea554 العملات المشفرة9 910...

📈 نظرة تحليلية على قناة تيليجرام ordinary subinium

تُعد قناة ordinary subinium (@web3subin) في القطاع اللغوي الكورية لاعباً نشطاً. يضم المجتمع حالياً 10 071 مشتركاً، محتلاً المرتبة 9 910 في فئة العملات المشفرة والمرتبة 554 في منطقة Korea.

📊 مؤشرات الجمهور والحراك

منذ تأسيسه في невідомо، حقق المشروع نمواً سريعاً وجمع 10 071 مشتركاً.

بحسب آخر البيانات بتاريخ 25 يوليو, 2026، تحافظ القناة على نشاط مستقر. خلال آخر 30 يوماً تغيّر عدد الأعضاء بمقدار -97، وفي آخر 24 ساعة بمقدار 0، مع بقاء الوصول العام مرتفعاً.

حالة التحقق: غير موثّقة
معدل التفاعل (ER): يبلغ متوسط تفاعل الجمهور 20.34‎%. وخلال أول 24 ساعة من النشر يحصد المحتوى عادةً 9.54‎% من ردود الفعل نسبةً إلى إجمالي المشتركين.
وصول المنشورات: يحصل كل منشور على متوسط 2 049 مشاهدة. وخلال اليوم الأول يجمع عادةً 961 مشاهدة.
التفاعلات والاستجابة: يتفاعل الجمهور بانتظام؛ متوسط التفاعلات لكل منشور يبلغ 12.

📝 الوصف وسياسة المحتوى

يصف المؤلف القناة بأنها مساحة للتعبير عن الآراء الذاتية:
“진짜가 되고 싶은. 채팅방: https://t.me/web3subinchat * 모든 의견은 개인 의견이며, 제가 속한 회사, 조직 등을 대변하지 않습니다. 모든 내용은 특정 자산에 대한 경제적 조언이 아니며, 이에 대해 책임지지 않습니다.”

بفضل وتيرة التحديث المرتفعة (أحدث البيانات بتاريخ 26 يوليو, 2026) تحافظ القناة على حداثتها ومستوى وصول مرتفع. وتُظهر التحليلات تفاعلاً نشطاً من الجمهور، ما يجعلها نقطة تأثير مهمة ضمن فئة العملات المشفرة.

10 071

المشتركون

لا توجد بيانات24 ساعات

-157 أيام

-9730 أيام

2 049

عرض المشاهدات

~ 96124 ساعات

~ 1 21948 ساعات

20.34%

معدل المشاركة

لا توجد بيانات

المشاركات في اليوم

Ads index

beta

أرشيف المشاركات

10 071

opus5가 fable5보다 가볍고 빠르고, 특히 성능은 체감도 비슷한 것 같고 이전 sonnet 4.5에서 느꼈던 알잘딱갈센스러운 부분도 있어서 좋네요. 다만 ai들의 문체가 점점 slop스럽게 가고 있어서 이건 이제 개인화된 스킬이 필수로 느껴지네요. 현재 codex/claude 합쳐서 3-4개 정도 구독을 유지하고 있으며 다음과 같은 상태입니다. - coding & loop: 5.6 sol xhigh - 단일 질의: 5.5 Instant / 5.6 pro - web dev/docs/design: opus5 - simple web automation: chrome extension claude - 비용효율적 단순 작업 및 우회(?)작업: composer 2.5 grok과 중국 선진 모델도 사용해봐야 하는데 아직 개인적인 작업에 쓸 일이 별로 없네요

10 071

최근 Kaggle에서 최적화 대회 참여했는데 종료 3일전까지만 해도 100위권이다 막판에 미끄러져서 200등권으로 bronze medal. 회고해보면 시간도 테크닉도 부족했는데 루프 엔지니어링과 visual interface 기반 eda 도구의 완성도가 낮았고 기본적으로 수학적 사고도 많이 퇴화한듯. 여튼 이제 다시 시작이니까 아쉬움은 빨리 떨치고 다시 경쟁력있는 엔지니어가 되기 위해 달릴 예정. https://x.com/subinium/status/2077538119193378869?s=46&t=_9QK1B_9Xfb5kENxfV3x-g

10 071

일단 자원차이가 있긴한데 매우매우까진 아님.

10 071

Repost from 캘빈의 감금원

주칸의 ICML 후기 한국 AI 스타트업이나 랩실의 연구력이 생각보다 너무 떨어짐. 인재유출 방지 / 해외영입을 위한 대책이 필요해보인다. LG AI리서치를 제외, 한국 AI 모델 개발자들에 대해 매우매우 베어리시하다 https://x.com/jukan05/status/2076205112750379183?s=20

10 071

리서치 작업에서는 sol이 fable보다 좋음. 근데 여전히 웹개발 알잘딱갈센은 4.8 max가 손맛이 좋음. 리서치 센트릭 작업에서 토큰가성비는 sol xhigh가 개인적으로는 제일 좋음. 그래서 codex 하나 더 구독함. claude는 두 개에서 하나로 줄일 것 같음.

10 071

icml6일차: 확실히 대-LLM시대라 그런지 포스터존에 이론 논문보다 application논문이 많아보이고 사람들도 거기에 몰려있음 생각해볼 수 있는 정말 다양한 구성들이 다 paper로 있는 느낌. 확실히 산업보다 더 앞서간게 학계. 근데 또 연구만큼 중요한 건 프로덕트고, 실제로 monetization 할 수 있으면 연구낼 필요가 없긴함. 그래서 발표 세션들은 있는데 이 중에서 openai/anthropic 페이퍼 아직 하나도 못봄.

10 071

근데 머리길고 동그래서 그런가 정종 중국어로 종종 말검🫠

10 071

icml 5일차: 워크샵 티켓만 있어서 오늘은 세션듣고 포스터 보기 워크샵은 좀 제너럴한 내용 들으러가서 끄덕끄덕하다가, 포스터 가서 수백개 논문에서 감탄 일단 나중에 읽을 논문들만 포스터 사진찍어두는 중 사진은 openai bio/lifescience 발표 세션.

10 071

GPT5.6 SOL ULTRA는 진짜 토큰이 녹네요. 아직 결과가 안나와서 성능 체크는 못해봄.

10 071

브라운대 (Economy로 유추되는) 교수님이 중간고사에 학생들이 AI를 써서 기말은 대면 시험으로 변경했더니 다음과 같은 분포를 보여주었다고 합니다. (주황-중간, 회색-기말) 3명을 제외한 학생이 부정행위를 했다,,, S1, S22 둘 다 다른 의미로 레전드 https://x.com/paulg/status/2075031014628311236?s=20

10 071

OpenAI의 최근 레포트의 간단한 요약입니다. "SWE-Bench Pro에서 약 30% 작업에 문제가 있는 것으로 추정" 크게 4가지 케이스에 대한 이슈인데, 정리해보면 문제가 잘못되었거나 또는 채점 기준이 너무 엄격하거나 또는 너무 모호하거나 약하다.로 볼 수 있습니다. 살짝은 다르지만 비슷한 결로 저는 스스로에게 그런 질문을 던지고 있습니다. "AlphaFold의 모델을 생명과학 지식이 없는 엔지니어(=본인)가 사용하면 이것을 제대로 활용할 수 있을까?" 우선 저는 일단 충분한 가이드라인과 이를 해석할 수 있는 능력이 없다면 불가능하지 않을까 라는 현재 시점의 결론을 내렸습니다. 실제로 지금 살펴보는 많은 BioAI 리서치를 살펴보면 어느 순간 내가 뭐를 읽고 있지 싶기도 합니다. 부끄럽지만 해석 능력이 부족한 것이지요. 우리는 이미 꽤 오랫동안 개인은 물론 AI를 작은 그룹의 전문가 집단으로는 온전히 이해하거나 검증하기 어려운 문제를 풀기 위해 학습하고 사용하고 있습니다. 문제는 점점 더 복잡해지고 있고, 평가 대상도 점점 더 모델이 처음 마주하는 과제로 이동하고 있다는 것은 매우 긍정적이면서도, 하지만 그만큼 평가에서 false positive와 false negative가 생길 가능성도 커지고 있습니다. 결국 중요한 것은 모델이 정답을 맞혔는지만이 아닙니다. 그 답을 판단하는 기준점/루브릭이 적절한지도 봐야 합니다. 그리고 모델이 틀렸다면, 왜 틀렸는지, 어떻게 틀렸는지, 그 실패가 무엇을 드러내는지를 봐야 합니다. 벤치마크는 더더욱 해석하기 어려울 것이고, 그렇기에 AI가 좋아질수록 전문성의 가치는 사라지는 것이 아니라, 오히려 더 중요해집니다. > 모든 것이 자동화되는 미래에는 AI의 결과를 해석하고, 검증하고, 평가의 의미를 다시 물을 수 있는 사람만이 살아남는다. 라는 생각을 하며 오늘도 수없이 많이 생성되는 slop 숲에서 지식 한 그루를 하나씩 심어봅니다... https://openai.com/index/separating-signal-from-noise-coding-evaluations/

10 071

icml 3일차: zero부터 시작하는 커리어 생활은 쉽지 않다. => ICML 이번 어셉된 논문수가 6000편이 넘는데 자기 섹터가 아니면 (1) 진짜 그 해의 주목 받는 논문이 아니거나 (2) 프론티어랩 아니면 알 수가 없음. 큰 맥락에서 비슷한 테크닉을 쓰긴 해도 결국엔 서로를 깊게 알기란 이전에 비해 훨씬 불가한 상황. => 심지어 3년만에 AI를 돌아온 입장에서 엔지니어링이 아니라 "리서치" 레벨에서 보니 진짜 이해가 안되는 게 넘 많음. => 이직 1개월차, 실질 논문 0편 엔지니어인 상황에서 그리고 이번에 이벤트에서 수없이 거절/펜딩 당하며 이걸 돌아다니려니 스스로 답답한 마음이 큼. => 스스로에게 상당히 분하고 실망스러운 상황인데, 겸손한 햇감자의 마음으로 다시 하나씩 해봐야지..

10 071

icml 1일차 진짜 진짜 조금 대화해본 후기: 본인 말하는 감자와 다를 바 없음

10 071

AI for Science라는 분야에 처음 들어오고 얼마되지 않아 알게된 중요한 질문이 있습니다. “과학을 잘한다는 것은 무엇인가” 측정할 수 없는 것을 측정하는 것은 매우 어렵습니다. 예시로 수능 수학을 잘 본다면 이건 수학을 잘하는 것일까요? 어느 부분에서는 맞고, 어느 부분에서는 부정확한 부분이 맞습니다. 그래서 이 분야에 들어와서 처음 살펴본 것은 단순히 모델이나 시스템이 아닌 “벤치마크”였습니다. 각 벤치마크 논문을 읽다보니 벤치마크 제작은 단순히 데이터/정답으로 구성된 데이터셋과는 정당성 등의 차원이 달랐습니다. “이 질문들의 총합이 특정 분야의 역량을 측정할 수 있는가”, “데이터 유출 등의 문제는 어떻게 방지하는가” 등 그래서 일단은 수학/과학 도메인 LLM 평가 벤치마크들을 한곳에 모아보고 있습니다. 물론 각 분야마다 쓰는 AI 벤치마크도 있지만 우선적으로 “LLM을 활용한 과학”이라는 측면에서 모아보고 있습니다. 우선은 인용수/깃헙스타수/유명기관 등을 기준으로 모으고 있습니다. https://github.com/subinium/Awesome-Scientific-LLM-Benchmarks 참고하기 좋은 출발점이 되었으면 합니다.

10 071

요약하면 슬롯머신 하고싶으면 Claude Code /goal 쓰고, 결과물 뎁스 있게 가져가고 싶으면 명세 잘해서 Codex 쓰는 것이 경험적으로 좋음.

10 071

최근 Claude Code와 OpenAI Codex의 /goal을 번갈아 쓰면서 둘이 꽤 다르다는 것을 느끼고 있다. 루프엔지니어링이라기 보다는 그냥 바닐라 하네스에서 /goal을 쓰는 중. goal 명세에 따라 달라지겠지만, 경험상 Claude Code는 조금 더 러프하고 open-ended 목표에 잘 맞았고, Codex는 검증 기준과 산출물 규격이 정해졌을 때 더 버티컬하게 파고들어 퀄리티 향상에 도움이 되었다. 왜 이런 차이가 날까? 그래서 공식 문서를 좀 뜯어봤다. 먼저 둘은 "완전히 다른 원리"라기보다 같은 추상 루프를 다르게 구현했다. 둘 다 멘탈 모델 자체는 [목표 설정 → 작업 → 확인 → 계속/종료]로 해석할 수 있다. 차이는 이 루프를 어떻게 관리하느냐다. 미리 결론 부터 이야기하면 공식 문서와 공개 코드 기준으로 보면 Claude Code는 작업자 + 별도 평가자 구조로 단순한 hook인 반면, Codex는 루프를 위한 정보 관리 구조가 더 뚜렷하다. Claude Code의 /goal은 턴이 끝난 뒤 별도 평가자가 판단하는 구조로 문서에는 언급되어 있다. 더 정확하게는 "session-scoped prompt-based Stop hook의 wrapper라고 명시되어 있다. (언젠가 "다시" 오픈소스화가 된다면 실제로도 그런지 확인해보자) 목표에 맞게 기존 작업을 하고 나면, "작은 빠른 모델"이 goal 조건과 지금까지의 대화를 읽고 yes/no와 짧은 이유를 반환한다. 이 모델은 기본적으로 Haiku다. 여기서 Haiku 평가자가 도구를 직접 실행하거나 파일을 따로 읽지 않는다. 즉, 결과가 대화에 드러나야 Haiku가 판단할 수 있다. 다만 Haiku를 써본 사람이라면 알 것이다. 이걸 LLM Judge로 사용한다면, 똑똑하긴 해도 여전히 부족한 도구다. 그래서 성공 조건을 명확하게 하여야 평가 모델이 더 발산하거나, 잘못된 종료를 줄일 수 있다. 아니면 모델을 바꿀 수도 있는데, 또는 슬롯 머신처럼 발산을 원한다면 그것도 뭐 빌더의 역할이 아닐까 싶기도. Codex도 비슷하게 근거를 보고 종료 조건을 판단한다. (Claude가 어떻게 구현했는지는 몰라도) Codex는 깃헙에 공개된 오픈소스를 뜯어보면 코드에서 보이는 구성은 다르다. Codex의 goal은 단순히 프롬프트에 붙는 문장이 아니라 "현재 작업 흐름에 저장되는 목표 상태"로 다뤄진다. 실제 app-server 문서에는 thread/goal/set, thread/goal/get, thread/goal/clear가 있고, goal 객체에는 objective, status, tokenBudget, tokensUsed, timeUsedSeconds 같은 필드가 있다. 또 코드에는 모델이 goal을 다루기 위한 get_goal, create_goal, update_goal 도구가 정의되어 있고, 실행 루프에는 턴 시작, 도구 완료, 턴 종료, 유휴 시 continuation, 사용량 제한 같은 이벤트가 있다. 즉 Codex는 /goal을 이어가고 판단하기 위해 goal 상태, 사용량, 도구 호출, 턴 종료, 중단 조건 같은 실행 맥락을 더 구조적으로 관리한다. 더 뜯어보면 Codex repo 안에 goal continuation prompt도 직접 들어 있다. 이 프롬프트는 "active thread goal을 계속하라", "목표를 더 작고 쉬운 것으로 재정의하지 마라", "현재 worktree와 외부 상태를 근거로 삼아라". 그리고 완료 전에는 파일, 명령 결과, 테스트, 로그, 실행 상태 같은 근거로 요구사항별 감사를 하라고 한다. 증거가 약하거나 일부만 맞으면 complete로 표시하지 말고 계속 작업하라는 것. 즉 Codex의 /goal은 단순 확인의 반복보다는 목표 상태, 도구 호출, 예산, 막힘 판단, 완료 감사가 묶인 근거 기반 실행 루프에 가깝다. 그래서인지 /goal에서 "막혔을 때 다음 전략 및 행동"을 명시해주면 훨씬 더 좋은 결과로 이어진다. 그리고 아무리 많은 정보를 수합하더라도 이것도 마찬가지로 LLM Judge이기에 여전히 goal은 명확하고 AI가 판단할 수 있는 범위가 무엇인지 아는 것이 중요하다. loop engineering의 핵심은 결국 LLM Judge를 얼마나 잘 설계하고, 얼마나 judgeable한 goal을 주느냐에 달려 있다.

10 071

개인적인 업데이트: 또다시 보여줘야 해 https://x.com/subinium/status/2072834486333845661?s=46&t=_9QK1B_9Xfb5kENxfV3x-g

10 071

저는 요새 이런 것을 보고 있습니다. "공학"의 세계에서 "이학"의 세계와 약간의 접점을 오랜만에 왔는데 지난 한 달 간 해당 산학의 트렌드를 팔로우 하고 있느라 한동안 공유가 뜸했습니다. 이제 재밌는 AI와 과학들로 컨텐츠를 채워보도록 하겠습니다. —- Claude Science. Antrophic은 6월에 bio/chem에서 각각 블로그가 올라오며 AI for Science 분야에서 성과를 하나씩 보여주더니, 예상한대로 오늘 Claude Science 툴을 공개했습니다. 이들의 방향성은 genomics, single-cell, proteomics, structural biology, cheminformatics, - 넓게 보면 생명과학/화학 - 등의 분야에서 사용되는 다양한 파편화된 도구를 하나로 모았습니다. 여기서 도구란 python/R 등의 언어와 라이브러리이기도 하며, Jupyter같은 개발 환경이기도 하고, GPU 및 SSH 연결 등의 미들웨어/인프라이기도 하며, OpenFold, Boltz, Evo 등의 모델이기도 합니다. 논문 리뷰 워크플로우 까지 제공됩니다. 한마디로 Claude Code for Scientist로 볼 수 있습니다. 이 과정에서 Nvidia가 꾸준히 업데이트하고 있는 BioNeMo와 올해 공개한 BioNemoAgent Toolkit 등이 있었기에 쉽게 도구화된 부분도 있습니다. 이미 Biology에서 코어가 될 수 있는 데이터와 foundation model을 플러그인 형태로 쓸 수 있으며 skill이 잘 담겨있는 오픈소스입니다. Antrophic 블로그에서는 이 툴킷을 사용하였다고 언급되어 있습니다. 이들이 빠른 것인가라고 한다면 현재는 모든 프론티어 랩들이 각자의 영역에서 버티컬을 만들고 실험하는 단계에 있습니다. 예시로 OpenAI는 지난 4월에 생명과학 분야에서 여러 task에(유기화학, 단백질 시퀀스 분석, 실험설계 등) 대해 기존 도구보다 성능 향상을 보여준 GPT-Rosalind 공개, 6월에는 이런 생명과학AI를 위한 벤치마크인 LifeSciBench와 GenBench-Pro, 그리고 화학에서는 실험 준-자동화에 대한 사례로 Molecule.one과 함께 GPT5.4와 Maira 에이전트로 보여준 바가 있습니다.

10 071

loop engineering 혹은 /goal의 실험과 관찰 결과 대부분 실패는 llm as a judge를 확률 게이트로 쓰며 발산과 강한 수렴을 방지하지 못하기에 발생한다. 좋은 목적함수를 설계하지 않으면 실패는 당연한 결과이다. 발산과 동시에 local optima에 빠지는 경우도 종종 발생하는데, 동적으로 해당 결과물에서 다른 요소를 건드림으로 이를 빠져나올 방안을 구성에 넣어야 한다. 이 외에도 루프 엔지니어링은 하나의 추상화된 nn의 학습 프로세스와 비슷한 부분이 많다. 연장선으로 이 루프라 함은 단일 과정에서 추출 가능한 “단일 스킬”로 대체될 수 있다기 보단 잘 설계된 광범위한 월드 모델로 설계되어야 한다는 생각이 든다.

10 071

최근 주변 사람 평균 연령대가 20대 초중반으로 기존보다 훅 낮아졌는데 왜 선배들이 아침/저녁에 운동하고 언어공부하고 했는지 알게되었습니다.