苹果的Ferret是一种新的开源机器学习模型
苹果公司和康奈尔大学的研究人员在 10 月份悄然推出了开源多模式法学硕士,这是一项名为“Ferret”的研究版本,可以使用图像区域进行查询。
10 月份Github 的推出基本上没有引起人们的注意,没有任何公告或大肆宣传。Ferret 的代码于 10 月 30 日与 Ferret-Bench 一起发布,并于 12 月 14 日推出了检查点版本。
据VentureBeat报道 ,虽然一开始并没有引起太多关注,但周六的发布对人工智能研究人员来说变得更加重要。人工智能医学非营利组织的运营商 Bart De Witte在 X 上发布了关于“错过”的发布,称其“证明了苹果致力于有影响力的人工智能研究”。
Ferret 的开源发布是在非商业许可下进行的,因此在当前状态下无法商业化。然而,它总是有可能以某种方式用于未来的苹果产品或服务。
Apple AI /ML 研究科学家 Zhe Gan在 10 月份的一条推文中解释了 Ferret 的用途,该系统可以“在图像中以任何粒度引用和定位任何位置的任何内容”。它还可以通过使用图像内任何形状的区域来实现这一点。
简而言之,该模型可以检查图像上绘制的区域,确定其中对用户在查询中有用的元素,识别它,并在检测到的元素周围绘制边界框。然后,它可以使用该标识的元素作为查询的一部分,然后以典型的方式对其进行响应。
例如,突出显示图像中的动物图像并询问法学硕士该动物是什么,它可以确定该生物的物种以及用户指的是群体中的单个动物。然后,它可以使用图像中检测到的其他项目的上下文来提供进一步的响应。
版权声明:网站作为信息内容发布平台,为非经营性网站,内容为用户上传,不代表本网站立场,不承担任何经济和法律责任。文章内容如涉及侵权请联系及时删除。