超小的TTS模型 Kitten TTS：參數量僅爲 1500 萬

近日，KittenML 團隊在 Hugging Face 平臺上發佈了其新款開源文本轉語音模型 ——Kitten TTS。這一模型的設計目標是實現高質量的語音合成，同時保持輕量級和高效能，適合在各種設備上進行部署。Kitten TTS 的參數量僅爲1500萬，相比於其他同類模型，其體積小於25MB，特別適合資源有限的環境。

Kitten TTS 支持無 GPU 運行，這意味着用戶可以在普通的 CPU 設備上進行語音合成，極大地降低了使用門檻。該模型還提供了多種高質量的語音選項，確保生成的語音更加自然流暢，適合用於各類應用場景。此外，Kitten TTS 的推理速度也得到了優化，可以實現實時語音合成，滿足用戶對速度的需求。

爲了讓用戶快速上手，KittenML 還提供了簡單的安裝和使用指南。用戶只需通過 pip 命令安裝相應的庫，並通過簡單的代碼調用模型，即可生成高質量的語音。例如，用戶只需輸入文本 “這個高質量的 TTS 模型無需 GPU 即可運行”，模型便會輸出相應的音頻文件，方便用戶保存和使用。

Kitten TTS 目前處於開發者預覽階段，未來還將發佈全面訓練的模型權重，移動 SDK 以及網頁版，進一步拓展應用範圍。KittenML 希望通過這一模型，推動文本轉語音技術的普及，幫助更多開發者和企業在其項目中輕鬆實現語音合成功能。

Kitten TTS 的發佈標誌着 AI 語音合成技術向更廣泛應用的又一步，期待這一模型在未來能夠爲更多用戶帶來便利和創新的體驗。

項目：https://huggingface.co/KittenML/kitten-tts-nano-0.1

劃重點:
🐱 Kitten TTS 是一款開源的輕量級文本轉語音模型，體積小於25MB，適合各種設備。
⚡ 模型支持無 GPU 運行，確保用戶在普通 CPU 上也能進行高質量語音合成。
🚀 Kitten TTS 已提供簡單的安裝和使用指南，用戶可快速上手並生成音頻。

百度搜索 PC 端全面上線 AI 搜索功能

百度PC端搜索全面升級AI功能，推出"超級智能雙行框"和"工作臺"模塊。工作臺包含AI閱讀（一鍵總結文檔）、AI寫作（20+文風可選）和AI PPT（自動生成）三大工具。數據顯示百度AI搜索月活超3.22億，位居國內第一。用戶可自由切換智能/經典模式，智能模式下可使用全部AI功能。此次升級顯著提升搜索效率，展現百度AI技術實力。

反超OpenAI！百川智能開源醫療大模型 Baichuan-M2能力全球登頂

百川智能發佈開源醫療大模型Baichuan-M2，在HealthBench評測中以60.1分超越OpenAI等競爭對手，成爲全球領先的開源醫療模型。該模型採用輕量化設計，支持RTX4090單卡部署，成本較同類方案降低57倍，並推出優化版本提升74.9%處理速度。特別注重醫療隱私需求，支持私有化部署。研究發現其醫療數據訓練不僅未削弱通用能力，反而提升了數學、寫作等表現。在複雜醫療問題處理上達到GPT-5水平，成爲全球第二款HealthBench Hard評分超32分的模型。

人工智能助力醫療影像分析，減輕放射科醫師負擔

澳大利亞科研機構AEHRC正利用視覺語言模型(VLM)技術革新醫療影像分析，重點開發能自動生成胸部X光報告的AI系統。該技術通過海量醫療數據訓練，已顯著提升報告準確性，並嘗試整合急診記錄進一步優化。研究團隊強調AI旨在輔助而非替代醫生，目前正與醫院合作評估AI報告與人工報告的差異，未來將擴大臨牀試驗驗證技術普適性。核心突破在於緩解放射科醫生短缺壓力，同時確保技術應用的倫理安全性。

通義千問 Qwen Code 每日免費調用2000次，比 Gemini 更大方

阿里雲通義千問推出Qwen Code AI編程智能體，爲中國大陸用戶提供每日2000次免費調用權限，海外用戶1000次。該工具支持終端命令行操作，相比Google Gemini CLI等競品具有更高免費額度和更簡易安裝流程（僅需一行命令）。阿里雲通過免除Token限制、簡化安裝步驟及提供GitHub開發者資源，旨在降低AI編程工具使用門檻，搶佔市場份額，特別在中國大陸市場憑藉高免費額度吸引開發者。

小鋼炮4.0視覺模型MiniCPM-V 4.0，手機端應用更流暢

MiniCPM-V4.0人工智能模型引發關注，這款4.1億參數的新模型在視覺理解方面表現優異，OpenCompass評測得分69.0超越多款競品。其最大亮點是專爲移動設備優化，在iPhone16Pro Max上響應迅速且無發熱問題。開發團隊提供了iOS應用和詳細指南，支持多種平臺工具，讓用戶輕鬆上手使用。