暂无评论
多模态 GPT 模型作为一种强大的预训练语言模型,能够处理文本、图像、音频等多种形式的数据,在自然语言处理领域展现出巨大潜力。为了进一步提升模型训练效率和应用性能,将多模态 GPT 模型与 Baize
研究了多模态身份识别问题,结合人脸和掌纹两种不同生理特征,提出了基于特征融合的多模态身份识别方法。对人脸和掌纹图像分别进行Gabor小波、二维主元变换(2DPCA)提取图像特征,根据新的权重算法,结合
近年来,结构性磁共振成像(sMRI)和功能性磁共振成像(fMRI)被广泛应用于抑郁症研究。从结构形态学、结构网络、功能网络3个角度探索抑郁症患者的大脑异常,了解其发病机制,辅助医生临床诊断、治疗和预后
针对视频自动描述任务中的复杂信息表征问题,提出一种多维度和多模态视觉特征的提取和融合方法。首先通过迁移学习提取视频序列的静态和动态等多维度特征,并采用图像描述算法提取视频关键帧的语义信息,完成视频信息
实现稳健的目标跟踪,建立有效的目标在线模型至关重要。针对现有在线学习跟踪算法缺乏对目标观测信息是否有效的判断,提出了一种简单且高效的解决方法。利用正负样本构建目标在线模型,基于压缩感知理论从多尺度图像
PDF文档,介绍一种基于哈希链表的高效概念漂移连续属性处理算法。
多模态多视图视频编码的新方法
一种基于多信息综合的人脸跟踪算法
NULL 博文链接:https://gang-zai.iteye.com/blog/545058
NULL博文链接:https://xiaobing259-163-com.iteye.com/blog/1261525
暂无评论