草根蜀财网

网站首页 科技 > 正文

苹果的Ferret是一种新的开源机器学习模型

2023-12-25 16:05:12 科技 来源:
导读 苹果公司和康奈尔大学的研究人员在 10 月份悄然推出了开源多模式法学硕士,这是一项名为Ferret的研究版本,可以使用图像区域进行查询。10

苹果公司和康奈尔大学的研究人员在 10 月份悄然推出了开源多模式法学硕士,这是一项名为“Ferret”的研究版本,可以使用图像区域进行查询。

10 月份Github 的推出基本上没有引起人们的注意,没有任何公告或大肆宣传。Ferret 的代码于 10 月 30 日与 Ferret-Bench 一起发布,并于 12 月 14 日推出了检查点版本。

据VentureBeat报道 ,虽然一开始并没有引起太多关注,但周六的发布对人工智能研究人员来说变得更加重要。人工智能医学非营利组织的运营商 Bart De Witte在 X 上发布了关于“错过”的发布,称其“证明了苹果致力于有影响力的人工智能研究”。

Ferret 的开源发布是在非商业许可下进行的,因此在当前状态下无法商业化。然而,它总是有可能以某种方式用于未来的苹果产品或服务。

Apple AI /ML 研究科学家 Zhe Gan在 10 月份的一条推文中解释了 Ferret 的用途,该系统可以“在图像中以任何粒度引用和定位任何位置的任何内容”。它还可以通过使用图像内任何形状的区域来实现这一点。

简而言之,该模型可以检查图像上绘制的区域,确定其中对用户在查询中有用的元素,识别它,并在检测到的元素周围绘制边界框。然后,它可以使用该标识的元素作为查询的一部分,然后以典型的方式对其进行响应。

例如,突出显示图像中的动物图像并询问法学硕士该动物是什么,它可以确定该生物的物种以及用户指的是群体中的单个动物。然后,它可以使用图像中检测到的其他项目的上下文来提供进一步的响应。


版权说明: 本文由用户上传,如有侵权请联系删除!


标签: