欧易

欧易(OKX)

国内用户最喜爱的合约交易所

火币

火币(HTX )

全球知名的比特币交易所

币安

币安(Binance)

全球用户最多的交易所

有人翻小红书种草,有人却翻到了最新AI技术趋势

时间:2023-02-06 14:26:03 | 浏览:708

小红书变了。你以为它还在“美妆”、“穿搭”,但现在在社交媒体上,关于小红书的不少说法画风却有些令人意外。俨然有了那么一点“搜索引擎”的味道。这是发生了甚么事?扒了扒数据,我们发现,去年一年,小红书科技数码内容同比增长500%、体育赛事同比增

小红书变了。

你以为它还在“美妆”、“穿搭”,但现在在社交媒体上,关于小红书的不少说法画风却有些令人意外。

俨然有了那么一点“搜索引擎”的味道。

这是发生了甚么事?

扒了扒数据,我们发现,去年一年,小红书科技数码内容同比增长500%、体育赛事同比增长1140%,美食类消费DAU甚至一度超过美妆。

而在小红书的首页,下拉菜单中的品类标签已经多达30多个。做菜教程、居家指南、户外露营、旅游攻略、考研考公甚至是创业,其内容之广泛,早已远超当年安身立命的美妆赛道。

更有意思的一个数据是,小红书此前对外披露,有高达30%的用户进入到小红书之后会直接进行搜索

也就是说,不断泛化的UGC内容正在不断冲击突破小红书的社区内容版图,而随之而来的用户行为,也已完全不同于外界对小红书的固有想象。

从外界看去,小红书的变化不可谓不大。从内部技术的角度出发,面临的挑战其实也正在成倍递增。

内容泛化和高频搜索,加上图片、文字、视频等不同模态内容混杂,对搜索和推荐优化来说都提出了更高的要求。

再者,互联网用户对于内容质量的要求日益提升,要求平台、机器能更进一步把握用户心理的需求始终都在增长。

所以,背后愈加复杂的搜索、推荐机制,应该如何应对?

内容社区的多模态挑战

作为为数不多的大量图文+短视频混杂的内容社区,小红书给出的关键词是:多模态学习

所谓多模态,指的是文本、图像、声音等不同的信息表现形式。

而多模态学习,要做的就是建立起能把不同类型信息结合起来的统一模型。

简单来说,一旦AI能够将不同形态的信息,如图像和文字融会贯通,就能在“理解”这件事上更进一步。

也就能达成这样的效果:

让AI根据“空中天使,虚幻引擎效果”的提示作画,AI会给出如下答案。

如果说AI看文作画还只是让人觉得“不明觉厉”,多模态技术对于互联网产品更实际的意义究竟在何处?

就在最近,小红书技术团队举办的一场对外的AI公开课,就分享了他们在多模态算法上的探索。从中恰好可以一窥当前学术界热度正酣的“多模态学习” + 拥有海量UGC内容的内容社区会产生怎样的化学反应。

多模态搜索

先来看搜索。

在打开小红书搜索结果页时,App还会给用户推荐更多相关的搜索词:

以往,这些查询词是纯文本的形式。

而在应用多模态技术之后,现在,这些查询词多了一层更美观且有关联性的“底图”。也就是说,AI会自动筛选出与查询词相匹配的图案,并在搜索结果界面展示给用户。

别看只是这么一个简单的改变,小红书多模算法组负责人汤神透露,加入该功能后,UVCTR(独立访客点击率)和PVCTR(页面浏览量点击率)提升了2-3倍

除此之外,多模态技术在搜索中的另一重点体现,就是以图搜图

有关商品、植物花卉等特定物品的图片搜索,并不鲜见。不过,如果用户想要搜索的是某种氛围感、某种整体风格呢?

这实际上是给AI提出了一个新的挑战:复杂环境下的物体检测与识别。

△搜表情包

为了解决这个问题,小红书技术团队以三个核心模块实现了离线构建和在线索引的能力:

    前置模块

    特征大规模检索

    排序模块

在前置模块中,技术团队研发了多种多模态标签,覆盖目标检测、主题识别、商品属性、人体属性等诸多维度。

在特征模块中,技术团队通过基于Norm Classifier的多任务学习,解决了召回结果类目不一致的问题。

在排序模块中,技术团队利用OCR以及标题中抽取出的品牌词等NLP相关信息,进行多模态信息集成,显著提升了检索准确率。

内容质量评价体系

而如果说搜索的变化更容易被看见,多模态技术在内容质量评价中的应用,则在更深层次上影响着小红书的整体“