ChatGPTの新機能公開:過去のチャット学習、記憶のリセット、閲覧後消去

オーストラリアの研究機関AEHRCは、視覚言語モデル(VLM)技術を利用して医療画像分析を革新しており、胸部X線の報告書を自動生成するAIシステムを開発しています。この技術は膨大な医療データで訓練されており、報告書の正確性を著しく向上させています。また、緊急時の記録を統合してさらに改善することも試みられています。研究チームは、AIが医師を補助するものであり、代替するものではないと強調しており、現在、病院と協力してAIによる報告書と人間による報告書の違いを評価しています。今後、臨床試験を拡大して技術の普遍性を検証する予定です。コア的な進展は、放射線科医の不足問題を緩和するだけでなく、品質を保証することにあります。
アリババクラウドのトゥンイー・チアンワンがQwen Code AIプログラミングスマートエージェントを発表し、中国大陸ユーザーに毎日2000回の無料利用権限を提供し、海外ユーザーには1000回を提供しています。このツールは端末のコマンドライン操作をサポートしており、Google Gemini CLIなどの競合製品と比較して無料枠が高く、インストールプロセスもシンプルです(1行のコマンドで完了)。アリババクラウドはトークン制限を免除し、インストール手順を簡略化し、GitHubでの開発者リソースを提供することで、AIプログラミングツールの利用門檻を下げる意図があり、市場シェアを奪取することを目的としています。
MiniCPM-V4.0は4.1億パラメータのAIモデルで、視覚理解に優れ、OpenCompassで69.0点を獲得。モバイル最適化され、iPhone16Pro Maxで高速動作。iOSアプリとガイド提供中。....
KittenMLチームがオープンソースの軽量なテキストから音声への変換モデルKitten TTSをリリースしました。サイズは25MBで、パラメータ数は1,500万、CPUでの動作をサポートしGPUは不要です。このモデルは高品質な複数の音声オプションを提供し、推論速度を最適化してリアルタイム合成を実現しています。また、簡単なインストールガイドも用意されています。現在は開発者プレビュー段階であり、今後、完全なモデル重み、モバイルSDK、およびWeb版が公開される予定です。これにより、音声合成技術の普及と応用が促進されます。
OpenAIが中国でGPT-5の商標登録を申請したが、阻害を受けている。複数の商標は却下と再審査状態にある。以前に深圳の会社が申請したGPT-5の商標はすでに却下されている。商標登録が妨げられたとしても、GPT-5はOpenAIの最新のAIモデルであり、健康相談やプログラミングなどの分野で特に優れた成果を収めている。この出来事は、AI分野における知的財産権の競争が激化していることを示しており、商標登録は企業が核心技術を保護する重要な要素であることがわかる。
GoogleがBlenderFusion 3Dビジュアル編集フレームワークを発表。SAM2などの視覚モデルで2D画像から3Dオブジェクトを抽出し、Blenderで編集後、最適化した拡散モデルで合成。複雑なシーン処理能力を向上させ、デザイナーに直感的な創作体験を提供。....