[国外] Activeloop 融资 1100 万美元,用于扩大其用于 AI 训练和推理的专用张量数据库

WX20240327-145810@2x.png

Activeloop是专门为人工智能工作负载而设计的数据库平台的创建者,该公司3月26日表示,它已经完成了 1100 万美元的早期融资,使其融资总额达到约 2000 万美元。

该公司表示,今天的 A 轮融资由 Streamlined Ventures 领投,Y Combinator、Samsung Next、Alumni Ventures 和Dispersion Capital 参与其中。

这家初创公司的正式名称为 Snark AI Inc.,创建了一个名为Deep Lake的专业数据库,旨在简化非结构化信息(例如音频、视频、图像、文本文件和嵌入)到机器学习和大语言中的流动。楷模。它还提供数据存储和知识检索功能,用于管理人工智能的复杂数据集。Deep Lake 是一个下载量超过 100 万次的开源平台。

Activeloop 创始人兼首席执行官 Davit Buniatyan 告诉 SiliconANGLE,Deep Lake 解决了为 AI 解锁多模态数据的问题,而这对于传统数据库来说基本上是无法访问的。它通过以所谓的“张量格式”存储非结构化数据文件来实现这一点,“张量格式”是机器学习本机的数学表示形式,使人工智能算法可以轻松获取这些信息。

“这种格式还使用户能够查询复杂的数据,就像使用 SQL 查询结构化表一样,”首席执行官说。“Activeloop 提供了一种可视化大型数据集、管理数据集版本(如 Git)以及使用类似 SQL 的张量查询语言对其进行查询的方法。”

Buniatyan 表示,Activeloop 还开发了一种更快速的数据加载器,使信息能够有效地传输到图形处理单元,从而更快地训练人工智能模型。他表示,这是一项关键创新,因为当用户处理人工智能训练所需的庞大数据集时,不可能一次性将所有这些信息放入 GPU 中。

“相反,公司有时所做的是将数据从存储物理复制到 GPU 的位置,这对于 100 GB 来说可能需要几个小时的 GPU 空闲时间,”Buniatyan 解释道。“相反,Activeloop 使公司能够传递足够的数据来进行计算,以便充分利用[GPU]。”

Activeloop 开发的另一项创新是其张量查询语言,它使公司能够更快地迭代他们收集的非结构化数据。他表示,正是这些快速迭代周期是确保人工智能快速部署的关键。

“简而言之,Activeloop 提供了传统数据湖的优势,但有一个关键区别:它以张量的形式存储复杂数据,促进数据快速流式传输到张量查询语言和浏览器内可视化引擎,而无需牺牲 GPU 利用率,”布尼亚蒂安说。

searching-for-elephants-in-the-dataset.png

该初创公司认为,其数据库平台已在生物制药、生命科学、医疗技术、汽车和法律等严格监管行业的财富 500 强客户中迅速采用。其最早的采用者之一是制药巨头拜耳股份公司 (Bayer AG) 的子公司拜耳放射学 (Bayer Radiology),该公司正在使用 Deep Lake 通过检索增强生成技术来训练和微调法学硕士和深度学习算法。

拜耳放射学首席成像技术科学家 Steffen Vogler 解释说,Activeloop 的技术帮助该公司解决了为 AI 模型准备数据的耗时过程。此前,其开发人员被迫处理复杂的多模式数据子集、控制数据版本并在新数据可用时不断集成新数据。

Deep Lake 使拜耳团队能够将这些不同的数据模式统一到单个数据源中,从而显着减少数据预处理时间。“这是一个新的水平,”沃格勒说。“我们启用了一种新的人机界面,该界面使用起来很自然,并为最终用户提供高精度的结果。”

Activeloop表示,与其他类型的数据库相比,其数据库可以提高数据检索的准确性,并减少LLM错误多达22%。此外,其人工智能原生嵌入式架构使其只需几行代码即可在本地环境中进行设置,使其成为寻求使用机密数据来生成人工智能工作负载的企业的理想选择。

Streamlined Ventures 普通合伙人 Ullas Naik 表示,企业很快意识到,释放复杂数据价值的唯一方法是使用Activeloop 的 Deep Lake 等系统。“鉴于他们良好的业绩记录,我们相信该团队能够执行其愿景,并很高兴再次投资,”他说。

Activeloop 表示,这些资金将用于让更多企业客户加入其人工智能数据库,并雇用更多员工来扩大其工程团队。

声明: 本站所有内容来源于用户上传,用来分享交流。如有资料或者图片不小心侵权,请发邮件(41835170@qq.com)告知!
分享到:
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

豫ICP备2024052610号-1 ©AI闹海