咪咕申请生成文本专利,可输出贴合图像内容的预测文本

   日期:2024-12-11    作者:e8ew9 移动:http://g8akg8.riyuangf.com/mobile/quote/7223.html

金融界2024年12月5日消息,国家知识产权局信息显示,咪咕文化科技有限公司申请一项名为“一种文本生成方法、装置及相关设备”的专利,公开号 CN 119067178 A,申请日期为2024年8月。

专利摘要显示,本申请提供一种文本生成方法、装置及相关设备,涉及人工智能的技术领域,所述方法包括:对待预测图像进行编码,得到图像特征;根据所述图像特征对关联所述待预测图像的非图像特征进行计算,得到第一注意力信息,以及根据所述非图像特征对所述图像特征进行计算,得到第二注意力信息,所述非图像特征用于表示所述待预测图像的上下文语境;对所述第一注意力信息和所述第二注意力信息进行融合,得到目标注意力信息;对所述目标注意力信息进行解码,得到预测文本。本申请通过图像特征和用于描述图像上下文语境的非图像特征的双向交互,可获得更加准确的注意力信息,进而得以输出贴合待预测图像的图像内容的预测文本。

本文源自:金融界


特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


举报收藏 0评论 0
0相关评论
相关最新动态
推荐最新动态
点击排行
{
网站首页  |  关于我们  |  联系方式  |  使用协议  |  隐私政策  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号