【AI日報】へようこそ!ここは、あなたの人工知能の世界を探求するための毎日のガイドです。毎日、AI分野のホットなコンテンツを提供し、開発者に焦点を当て、技術トレンドを理解し、革新的なAI製品の応用を学ぶお手伝いをします。

最新のAI製品詳細はこちら:https://top.aibase.com/

1、テキストから画像生成が盛り上がっている!智譜がオープンソースの画像生成モデルCogView3を発表、SDXLより10倍速い!

智譜AIが最近オープンソース化したCogView3とCogView-3Plus-3Bは、テキストから画像生成分野に新たな活力を吹き込みました。CogView3は独自の連鎖拡散法を採用し、生成品質はSDXLを上回り、推論速度は10倍速いです。CogView-3Plus-3BはDiTフレームワークに基づき、Zero-SNR拡散ノイズスケジューリングと統合テキスト-画像注意機構を最適化し、幅広い画像解像度に対応しています。智譜AIは、ユーザーがプロンプトを最適化するためのアドバイスとツールを提供し、使用のハードルを下げています。

image.png

【AiBase要約:】

🚀 CogView3は連鎖拡散法を採用し、生成品質はSDXLを上回り、推論速度は10倍速い。

💡 CogView-3Plus-3BはDiTフレームワークに基づき、Zero-SNR拡散ノイズスケジューリングと統合テキスト-画像注意機構を導入。

🔧 智譜AIは、プロンプトの最適化を支援するアドバイスとサンプルスクリプトを提供し、使用のハードルを下げる。

詳細リンク:https://github.com/THUDM/CogView3

2、AI音声クローン詐欺が進化!弁護士の父親から3万ドルを騙し取ろうとした電話

最近発生したAI音声クローン詐欺事件が大きな注目を集め、この技術がもたらす可能性のある大きなリスクを浮き彫りにしました。この事件は、高度にリアルなAI音声クローンに直面した際の人間の脆弱性を明らかにし、消費者を守るためにAI業界の規制強化を求める声が高まっています。この記事では、音声クローン技術の潜在的なリスクと積極的な用途、そしてハイテク詐欺への対処法についても触れています。

【AiBase要約:】

🚨 ハイテク詐欺:AI音声クローン技術が警鐘を鳴らす。詐欺師がAIを使って声を模倣して詐欺を行い、成功率は驚くほど高い。

💡 セキュリティ上の課題:人間はAI生成の音声を識別する際に高いエラー率があり、ディープフェイク検出ツールの開発が急務。

⚠️ リスク警告:新しい攻撃手法であるオーディオハイジャックは、複数のAI技術と組み合わされ、資金が偽の口座に送金される可能性がある。

3、3Dモデリングを覆す!GGHead:超高速高品質、キャラクターに一貫性のある3Dヘッド生成を実現

GGHeadは、ミュンヘン工科大学のTobias Kirschstein氏らが開発した革新的な3Dモデリング技術です。超高速で高品質で視点の一貫性のある3Dヘッドモデルを生成し、3Dモデリングのハードルを下げ、将来の人間モデリング研究に新たな可能性を切り開きます。

image.png

【AiBase要約:】

🌟 通常のGPUを使用して、高解像度の3Dヘッドモデルをリアルタイムで生成

💡 3Dガウス点群表現と2D CNNを使用してガウス属性を生成し、モデリング効率を向上

🔧 「全変動損失」技術を導入して幾何学的精度を向上させ、画像品質と一貫性を確保

詳細リンク:https://tobias-kirschstein.github.io/gghead/

4、全く新しい視覚認識技術Revisit Anything

この記事では、革新的な視覚位置認識技術Revisit Anythingを紹介します。入力画像から画像内の場所を識別できます。この技術はSAMとDINO技術を組み合わせることで、画像セグメントの検索効果を高め、より正確な場所の再認識を実現しました。研究チームは複数のデータセットを使用してテストを行い、ユーザーには17placesデータセットから始めることを推奨しています。特徴抽出、クラスタ中心の生成、SegVLADパイプラインの実行により、ユーザーは効率的な認識結果を得ることができます。この研究は、視覚位置認識分野の発展を促進しました。

【AiBase要約:】

🌟 SAMとDINO技術を組み合わせ、新しい視覚位置認識手法を発表。

📊 ユーザーはすぐに使い始めることができ、実験を実行し、詳細な手順とスクリプトで効率的な結果を得ることができる。

🔍 現代の深層学習モデルを用いた画像分析による、新しい視覚位置認識ソリューションを提供し、この分野の発展を促進。

詳細リンク:https://github.com/AnyLoc/Revisit-Anything

5、海信がAIチップ搭載のAIテレビE7Nを発表

海信が発表したE7N超画質Mini LEDテレビは、海信が独自開発したMini LED制御チップを搭載し、輝度は4000nitsに達し、バックライト制御が細かく、画面は鮮明で明暗がはっきりしています。内蔵の信芯AIチップは深層学習によって画質を最適化し、視聴体験は抜群です。性能も強力で、4つのHDMI2.1インターフェースをサポートしており、ゲーマーにも最適です。

image.png

【AiBase要約:】

🌟 E7Nは海信が独自開発したMini LED制御チップを搭載し、各チップは8個のLEDビーズを制御でき、4224個のゾーンに達し、輝度は4000nits。

🤖 海信初の国産ハイエンド画質チップである信芯AIチップを内蔵し、深層学習により色、コントラスト、鮮明度を最適化し、あらゆる番組の画質が会員レベルに達する。

🎮 E7Nは初めてMT9655SOCチップを搭載し、性能が164%と219%向上し、4つのHDMI2.1インターフェースをサポートし、ゲーム体験が大幅に向上。

6、オープンソース版Cursorと称するPearAIが350万ドルの資金調達直後に剽窃の指摘を受ける

オープンソース版Cursorと称するAIプログラミングツールPearAIは、最近Y Combinatorから50万ドルの資金調達を行い、イノベーション、模倣、商業化に関する議論を引き起こしました。創設者のPan氏は、製品の性能がC0pilotを上回ると主張していますが、他のオープンソースプロジェクトからの剽窃を指摘されています。この論争は、オープンソースの世界におけるイノベーションと模倣の境界、そしてテクノロジー企業におけるプロジェクトの独自性の誇張がもたらす可能性のある悪影響を浮き彫りにしています。

【AiBase要約:】

🔍 PearAIがY Combinatorから資金調達を受け、イノベーション、模倣、商業化に関する議論を引き起こす

💡 Pan氏は製品の性能がC0pilotを上回ると主張するが、他のオープンソースプロジェクトからの剽窃を指摘される

🌐 オープンソースコミュニティは、イノベーションを維持し、プロジェクトの価値を示す方法に直面する課題を抱える

詳細リンク:https://x.com/CodeFryingPan/status/1840464744626675719

7、カリフォルニア州のAI規制法案が否決:ニューサム知事、意図は良いが方法は適切ではないと発言

カリフォルニア州のニューサム知事が、注目を集めていたSB1047法案を否決し、テクノロジー界と政界で幅広い議論を引き起こしました。ニューサム知事は、この法案の意図は良いものの、AIシステムの具体的な適用環境やリスクレベルを考慮しておらず、国民を保護する最善の方法ではないと考えています。この決定は、AI規制の複雑さを浮き彫りにし、イノベーションの促進と安全性の確保のバランスを取るという課題を強調しています。

【AiBase要約:】

🔍 SB1047法案は、大規模AIモデルの開発を規制し、企業に安全プロトコルを実施するよう求めるものでしたが、シリコンバレーの多くの反対を受けた。

🚫 ニューサム知事が法案を否決し、AIシステムの具体的な適用環境やリスクレベルを考慮しておらず、国民を保護する最善の方法ではないと考える。

⚖️ ニューサム知事は、すでに17件のAI関連法案に署名しており、専門家の協力を得て実行可能なAI規制策を策定すると強調し、AI規制の複雑さを浮き彫りにしている。

8、SF雑誌がAI作品氾濫の衝撃に直面

近年の人工知能技術の急速な発展を背景に、オンラインSF&ファンタジー雑誌「Clarkesworld」はかつてない挑戦に直面しています。編集者たちは無力感と落胆を感じており、創作環境が悪化していますが、ボランティアがスパムフィルターを作成するのを支援することは一時的な対策に過ぎず、長期的な解決策はまだ模索中です。

【AiBase要約:】

🌊編集者たちは落胆を感じ、雑誌創設者が投稿受付を閉鎖したのはやむを得ない措置だった。

🛑AIの氾濫により創作環境が悪化し、ボランティアがスパムフィルターの作成を支援。

🔧長期的な解決策はまだ模索中で、SF雑誌はAI作品氾濫による存続の危機に直面している。

9、面倒くさい作業とはお別れ!ScreenPipeであなたの画面が24時間休まず「自動」で作業!

終わりのない会議記録や、さまざまなソフトウェア間の切り替えにうんざりしていませんか?オープンソースのAI画面録画ツールScreenPipeがあなたの悩みを解決します。24時間中断なく画面の活動と音声を記録するだけでなく、作業タスクも自動的に実行し、時間と労力を節約できます。

【AiBase要約:】

⏰24時間中断のない録画:画面の活動と音声データを完全に記録。

🤖 スマートアシスタントサービス:メモの自動更新、レポートの生成、データの入力など。

🔍 即時コンテンツ概要:重要な情報を迅速に抽出し、時間を節約し、重要なポイントを把握。

詳細リンク:https://github.com/mediar-ai/screenpipe

10、智譜AI 国慶節セール:10%オフで利用可能 + 1億トークン無料

智譜AIと清言科技は、それぞれ国庆節特別キャンペーンと新しいプレミアム会員システムを発表し、ユーザーにより多くのメリットと選択肢を提供します。智譜AIオープンソースプラットフォームbigmodel.cnでは、AIモデルを10%オフで利用可能にし、1億トークンを無料で提供することで、企業や開発者が高度なAIサービスを利用するコストを削減します。清言科技はプレミアム会員システムを発表し、月額19元で多くの特典を利用できるため、より幅広いユーザー層が高度なAI機能を利用できるようになります。

image.png

【AiBase要約:】

🎉 智譜AI 国慶節セール、AIモデルを10%オフで利用可能にし、企業や開発者のコストを削減。

💰 キャンペーンでは1億トークンを無料で提供し、より多くの人が高度なAI技術を体験できるようにする。

🚀 清言科技が月額19元からのプレミアム会員システムを発表し、より幅広いユーザー層が高度なAI機能を利用できるようにする。