バイトダンスと北京大学の研究チームがarXivに論文を発表し、大規模言語モデルのトレーニングに使用される生産システムMegaScaleを紹介しました。MegaScaleは10,000枚以上のGPUを単一クラスタに構築し、モデルFLOP利用率55.2%を実現しました。このシステムには、システムコンポーネントとイベントを監視し、根本原因を特定し、耐障害性と遅延問題の軽減を実現するための診断ツールも含まれています。
関連推奨
モデル推論の欠点に対応するため、アップルMINDチームはAI人材の採用を急いでいる
アップルは推論モデル専門家を積極採用し、大規模言語モデルの欠陥解決を目指す。新アーキテクチャ開発で推論・計画・ツール活用・エージェント機能の強化に注力。....
バイトダンスAIアシスタントのCiciが海外の多くの国でのアプリランキングでトップに:国内のドウバオとは2つのブランド戦略を採用
ByteDanceのAIアシスタントCiciが海外で好調、メキシコGoogleストアで1位、英国Appleストアでトップ10入り。豆包と同時展開の二重ブランド戦略で、開発元はByteDanceと確認。....
Notion3.0AIエージェントに深刻な脆弱性が発覚、悪意のあるPDFが機密データの漏洩を誘発
Notion3.0のリリースに伴い、新しく導入された自律型AIエージェント機能が注目を集めました。この機能は、ドキュメントの作成やデータベースの更新、業務プロセスの管理などのタスクを自動化することを目的としています。しかし、サイバーセキュリティ企業CodeIntegrityの最新報告書によると、これらのAIエージェントには深刻なセキュリティの脆弱性が存在し、悪意のあるファイル(例えばPDF)が利用されることで、エージェントがセキュリティ対策を回避し、機密データを盗む可能性があることが明らかになりました。CodeIntegrityはこの脆弱性を
伝統を打ち破る!Mini-o3 オープンソースモデルが超長時間の視覚的推論を実現 深層的な思考はもう難しくない
最近、バイトダンスと香港大学は、新たなオープンソースの視覚的推論モデルであるMini-o3を共同でリリースしました。これは多ラウンドの視覚的言語モデル(VLM)技術における大きな進展を示しています。従来の視覚的言語モデルが1〜2ラウンドの対話しか行えなかったのに対し、Mini-o3はトレーニング時に6ラウンドの対話に制限されていますが、テストでは数十ラウンドまで推論ラウンドを拡張でき、視覚的問題処理の能力を大幅に向上させています。Mini-o3の強みは、困難な視覚検索タスクにおいて深い推論を実現したことにあるのです。
バイチュンテックがUSOモデルを発表し、AI画像生成におけるスタイルとテーマの対立を打ち破る
ByteDanceがUSOモデルを発表、AI画像生成におけるスタイルとテーマの矛盾を解決。データ駆動でスタイルの類似性とテーマの一貫性を両立させ、業界の進歩を促進。....
