全球AI最前线 Ideogram发布2.0版本,多项指标上优于Flux Pro和DALL-E 3, 人工智能图像生成初创公司Ideogram近日推出其2.0版本产品,声称在图像质量和价格方面超越了Midjourney和DALL-E等竞争对手。 Ideogram 2.0引入了多项新功能: [*]五种图像风格:通用、逼真、设计、3D和动漫。其中"逼真" ...
全球AI最前线 Midjourney 推出网页版并免费试用 Midjourney 已将其 Web 界面向所有用户开放,并重新推出了免费试用图像生成功能。在使用Midjourney生成的AI 图像在社交媒体平台上传播后,该公司此前曾暂停免费使用。您可以在下面观看演示新 Web 界面的视频教程。 ...
全球AI最前线 火山引擎AI创新巡展上海站:豆包大模型能力提升,零售大模型生态联盟成立 在2024年8月21日举办的火山引擎AI创新巡展上海站上,豆包大模型的多项产品升级吸引了业界关注。火山引擎不仅展示了豆包语音模型和视觉模型的最新进展,还强化了对话式AI的实时交互解决方案,提升了AI交互体验。 火山 ...
全球AI最前线 a16z发布第三版《Top 100 Gen AI Consumer Apps》榜单 著名风险投资公司a16z发布了其第三版《Top 100 Gen AI Consumer Apps》榜单。这份榜单每半年更新一次,深入数据分析,列出了按月独立访问量排名的前50个AI优先的网络产品和按月活跃用户排名的前50个AI优先的移动应 ...
全球AI最前线 微软推出三款开源Phi-3.5系列人工智能模型 微软推出三款全新的Phi-3.5系列人工智能模型,这标志着该公司在AI领域的又一重大突破。新模型包括: [*]Phi-3.5-mini-instruct: 拥有38亿参数,适用于基础推理任务。 [*]Phi-3.5-MoE-instruct: 具有419亿参数的"专家混 ...
全球AI最前线 OpenAI推出GPT-4o模型微调功能 人工智能公司OpenAI于8月20日宣布,其旗舰大语言模型GPT-4o的微调功能现已全面开放。此举将使开发者能够为特定用例创建定制版本的GPT-4o模型。 GPT-4o是OpenAI最大、最复杂的模型,能够实时响应文本、音频和视频输入 ...
全球AI最前线 OpenAI与全球知名出版集团康泰纳仕达成内容合作协议 人工智能公司OpenAI近日与全球知名出版集团康泰纳仕(Condé Nast)签署了一项多年合作协议。根据该协议,OpenAI将获得使用康泰纳仕旗下《纽约客》、《Vogue》和《连线》等知名杂志内容的权限,用于训练其AI模型。同时, ...
全球AI最前线 谷歌开源HeAR:听声辨病,用AI分析咳嗽声评估健康状况 谷歌研究院近日开发出一套名为HeAR(Health Acoustic Representations)的AI系统,能够通过分析咳嗽和呼吸声来评估健康状况。该公司已公开发布这一系统的代码,供其他研究人员使用。 HeAR采用自监督学习方法,在超过3亿 ...
全球AI最前线 HuggingFace发布AI机器人开源指南"LeRobot" 人工智能公司HuggingFace近日推出了名为"LeRobot"的开源项目,发布了一份详细的AI控制机器人构建指南。该指南涵盖了从硬件组装、配置到训练控制神经网络的全过程,旨在降低AI机器人开发门槛,支持机器人领域的开源生态 ...
全球AI最前线 Luma Labs推出Dream Machine 1.5,AI视频生成能力显著提升 Luma Labs发布了其AI视频生成工具Dream Machine的1.5版本更新。尽管表面上看变化不大,但新版本在底层模型上进行了重大升级,带来了更高的真实感、更好的动作跟随能力和更强的提示理解能力。 自今年6月推出以来,Dr ...
全球AI最前线 Cohere创始人警告利润率趋零,AI创业公司生存危机 人工智能独角兽公司Cohere的首席执行官Aidan Gomez近日表示,AI模型的销售正迅速成为一项"零利润业务"。在最近的一次播客采访中,Gomez指出当前AI模型的成本高于收入,这种情况可能会持续一段时间。 虽然OpenAI和Anthr ...
全球AI最前线 宇树科技G1人形机器人即将量产,起售价16,000美元 中国机器人公司宇树科技近日宣布,其G1人形机器人已准备好进入大规模生产阶段。自今年5月首次亮相以来,G1经过工程师数月的优化,在外观和性能方面都有所提升。 G1身高1.32米,重35公斤,可折叠收纳。它配备了3D激 ...