智源研究院、中国电信、世界初の兆規模単体高密度モデルTele-FLM-1Tをオープンソース化

北京智源人工智能研究院と中国電信人工智能研究院（TeleAI）が共同開発したTele-FLMシリーズの大規模言語モデルが最近アップデートされ、52Bパラメータの指示追従モデルFLM-2-52B-Instructと、世界初の1兆パラメータ単体稠密モデルTele-FLM-1Tがリリースされました。関連技術レポートとモデルのチェックポイントも公開されています。

FLM-2-52B-Instructは、Tele-FLM-52B基盤モデルを基に指示微調整を行った指示対話モデルで、中国語での対話能力の向上に重点を置いています。教師あり微調整を行い、100万件のオープンソース指示データを用いてトレーニングを行い、3万件のデータサブセットで最適な結果を得ました。これらのデータには、数学の問題、コード、複数ターン対話データが含まれています。モデルのトレーニングでは、特定のバッチサイズ、学習率、エポック設定を採用し、AlignBench評価プラットフォームで評価を行いました。その結果、FLM-2-52B-Instructは中国語対話能力においてGPT-4の90％に達しました。

Tele-FLM-1Tは、世界初となるオープンソースの1兆パラメータ稠密モデルで、コスト削減のために増分学習方式を採用しています。モデル構造はGPTシリーズのデコーダーオンリーTransformerをベースに改良されており、InputとOutputの乗数、回転位置エンコーディング、RMSNorm、SwiGLUなどが追加されています。増分学習戦略には、横方向の拡張と縦方向の拡張があり、MSGを改良した保全演算子を使用しています。事前学習では、特定のハイパーパラメータ設定を採用しました。

FLM-2-52B-Instructモデル公開リンク:

https://huggingface.co/CofeAI/FLM-2-52B-Instruct-2407

Tele-FLM-1Tモデル公開リンク:

https://huggingface.co/CofeAI/Tele-FLM-1T

52B +1T技術レポートリンク:

https://arxiv.org/abs/2407.02783

52B基盤モデル技術レポートリンク:

https://arxiv.org/abs/2404.16645

バイトダンス、豆包・画像生成AIモデルを発表　豆包大規模言語モデルの1日あたりのトークン使用量が5000億を超える

火山引擎は成都で2024 AIイノベーション巡回展を開催しました。火山引擎は、豆包大規模言語モデルの1日あたりのトークン使用量が5000億を超え、5月15日のモデル発表以来、企業顧客1社あたりの1日あたりのトークン使用量が平均22倍に増加したと発表しました。火山引擎副社長の張鑫氏は、火山引擎がよりインテリジェント化、業界特化、地域特化の方向に進んでいること、そして業界ソリューション、製品、最適化されたサービスを通じて企業のビジネスイノベーションを支援していることを述べました。

Googleへの挑戦！OpenAIがSearchGPTをリリース、初期テスト参加者は1万人限定

OpenAIは、人工知能駆動の検索エンジンSearchGPTを発表しました。インターネット情報をリアルタイムでアクセスし、従来の検索エンジンとは異なり、音楽フェスの情報概要など、結果の整理と要約を提供します。現在プロトタイプ段階であり、GPT-4シリーズのモデルによってサポートされ、10,000人のテストユーザーのみに公開されています。このツールは、リンク一覧を提供するだけでなく、インターフェースを通じてユーザーのニーズを尋ね、検索結果では明確な出典とリンクを強調し、ニュースパートナーとの協力によりコンテンツの使用規範を確保しています。

OpenAIの5段階AGI戦略、業界から痛烈批判―華々しいだけの見かけ倒し？それとも真の未来予測？

OpenAIが5段階のAGI（人工汎用知能）ロードマップを発表。チャットボットレベルのL1から、L2推論者、L3エージェント、L4イノベーター、L5オーガナイザーへと段階的にAIの発展を示す枠組みを提示した。しかし、このロードマップはマスク氏を含む専門家から疑問視され、命名や定義の曖昧性、論理の混乱を指摘する声が上がっている。単なるマーケティング戦略ではないかとの見方もある。特に、超知能の定義の不明確さと5段階の順序の妥当性に関する疑問が集中。L3レベルのタスクは既に実現可能との指摘も出ている。

米上院、ディープフェイクポルノ対策法案を可決

米上院は、同意のないディープフェイクポルノ画像の制作・拡散に対処する『The Disrupt Explicit Forged Images and Non-Consensual Edits Act』法案を全会一致で可決しました。この法案は、被害者に法的救済手段を提供し、虚偽の画像を作成または拡散した個人や組織を訴訟で追及する権利を与えます。最高25万ドルの賠償金が認められ、著名人や青少年の保護を目指しています。

AI採用担当が物議を醸す：公平性を謳うも最大の「差別者」に、求職者はどう身を守る？

職場採用における人工知能の活用は、客観性と効率性を高めることを目的としていますが、研究により、偏見を増幅する可能性が明らかになっています。AIはデータから学習するため、データセットに偏りがあると、アルゴリズムが不公平な結果を生む可能性があります。人事担当者とAI開発者間の教育や専門性の違いは、効果的な協力を阻害し、偏見の特定と軽減の能力に影響を与えます。この問題を解決するためには、人事担当者のAIに関する知識を高めるための体系的な研修プログラムの実施、多様なデータセットを確保し、様々な集団を代表させるための異分野チームの協力促進、ガイドラインと倫理規定の策定が推奨されます。