苹果的Ferret是一种新的开源机器学习模型

发布时间：2023-12-25 16:05:12来源：

苹果公司和康奈尔大学的研究人员在 10 月份悄然推出了开源多模式法学硕士，这是一项名为“Ferret”的研究版本，可以使用图像区域进行查询。

10 月份Github 的推出基本上没有引起人们的注意，没有任何公告或大肆宣传。Ferret 的代码于 10 月 30 日与 Ferret-Bench 一起发布，并于 12 月 14 日推出了检查点版本。

据VentureBeat报道，虽然一开始并没有引起太多关注，但周六的发布对人工智能研究人员来说变得更加重要。人工智能医学非营利组织的运营商 Bart De Witte在 X 上发布了关于“错过”的发布，称其“证明了苹果致力于有影响力的人工智能研究”。

Ferret 的开源发布是在非商业许可下进行的，因此在当前状态下无法商业化。然而，它总是有可能以某种方式用于未来的苹果产品或服务。

Apple AI /ML 研究科学家 Zhe Gan在 10 月份的一条推文中解释了 Ferret 的用途，该系统可以“在图像中以任何粒度引用和定位任何位置的任何内容”。它还可以通过使用图像内任何形状的区域来实现这一点。

简而言之，该模型可以检查图像上绘制的区域，确定其中对用户在查询中有用的元素，识别它，并在检测到的元素周围绘制边界框。然后，它可以使用该标识的元素作为查询的一部分，然后以典型的方式对其进行响应。

例如，突出显示图像中的动物图像并询问法学硕士该动物是什么，它可以确定该生物的物种以及用户指的是群体中的单个动物。然后，它可以使用图像中检测到的其他项目的上下文来提供进一步的响应。

标签：

（责编： BAZHONG）