技术优势

  • 保险客户在线化智能运营图标

    自主研发AI大模型与核心算法

    基于自主开发的AI大模型,结合计算机视觉、语音克隆技术,实现高精度数字人生成、实时互动与多语言处理,支持复杂场景的智能化需求。

    智行大模型,高精度自然语言理解
    实时互动与多语言处理
    数字人形象生成、多语言跨境电商
  • 全栈数字人技术体系

    全栈数字人技术体系

    覆盖2D/3D数字人形象定制、语音克隆,支持24小时"日不落直播",适配电商、客服、教育等多场景,大幅降低内容生产门槛

    支持2D/3D快速生成数字人形象
    动作与交互,支持拟人化情绪表达
    覆盖电商直播、文旅虚拟代言人等场景
  • 多模态交互与XR融合

    多模态交互与XR融合

    整合AI虚幻舱、XR虚拟拍摄、AR/VR技术,打造沉浸式交互体验;虚拟与现实场景无缝衔接,提升品牌营销与用户参与感

    融合3D全息投影与实时语音交互,打造沉浸式体验
    虚拟拍摄技术,真人动作实时映射
    AR冰箱贴、3D文创手办等交互产品
  • 数字人多矩阵直播间

    海量数据集(动捕、3D、人脸数据)

    整合高精度动作捕捉、三维扫描建模、多维度人脸数据库,构建数据资产库;虚拟人驱动全场景赋能,推动数字内容生产效率跃升

    结合AI骨骼重定向,适配多领域应用
    支持UE5/Blender/Maya生成与物理仿真
    3D拓扑优化、人脸特征域迁移,突破小样本训练瓶颈

技术能力

智行大语言模型

  • 多模态Multimodality

    数据归一化:对不同模态的数据进行归一化处理

    多模态特定架构:将不同模态进行提取、融合和交互

    多模态预训练与微调:根据需求进行训练与微调算法

    多模态对话生成:实现更加自然和丰富的人机交互

  • 垂类Vertical Category

    知识图谱融合:将垂类领域的知识图谱与大模型相结合

    领域特定预训练:针对特定垂类领域对模型进行预训练

    多模态融合:将图像音频等多模态数据与文本数据进行融合

    上下文感知:通过对话状态跟踪技术处理多轮对话

  • 私有化Privatization

    本地服务器部署:将大模型部署本地上,确保数据安全和隐私

    加密技术:在数据交互处理过程中,使用加密算法对数据进行加密

    身份验证与授权:只有合法的用户能够访问私有化的大模型

  • 数据安全Data Secure

    授权管理:根据用户权限大小,对大模型数据资源进行授权管理

    数据脱敏:将敏感信息进行脱敏处理转化为非敏感信息

    模型加密:使模型在存储和传输过程中以密文形式存在

  • 响应迅速Quick Response

    模型并行化:将大模型划分为多个子模型,使得多个子模型同时计算

    分布式推理:将大模型的推理任务分布到多个计算节点上进行并行处理

    高效的推理引擎:选择合适的计算算法,减少模型推理的时间开销

声音克隆

  • 计算机视觉AutoCV

    垂类

    · 根据用户需求可以进行私有化部署

    · 保护用户数据隐私

  • 自然语言处理AutoNLP

    垂类

    · 根据用户需求可以进行私有化部署

    · 保护用户数据隐私

  • 语音识别AutoSpeech

    垂类

    · 根据用户需求可以进行私有化部署

    · 保护用户数据隐私

人脸融合

  • NeRFNeural Radiance Field‌‌

    人脸特征提取:利用深度神经网络快速检测出人脸关键点

    人脸姿态估计:准确地识别出人脸的各种姿态变化

    优化算法:优化人脸识别算法,以获得最佳的融合效果

  • 高斯溅射Gaussian Splatting

    联合优化策略:将高斯溅射与可变形表面(如 3DMM)同步优化

    Splat - to - Surface 距离度量

    空间密集化:利用可变形表面的信息来动态增删高斯点

  • 3D模型3D Model

    特征提取与匹配:提取人脸的特征信息

    图像变形与融合:根据人脸特征信息进行融合

    光照与色彩调整:对光照和色彩进行调整,使人脸看起来更加自然

三维重建技术

  • xitongkuangjia

    点云数据Point Cloud Data

    数据采集:通过激光雷达获取点云数据

    滤波与去噪:使用滤波算法除去噪点

    配准与分割:对多视角的数据拼接或对齐

    特征提取:提取点云数据中的特征信息

  • yigoujisuan

    深度信息Heterogeneous Computing

    多视角图像采集:从多个不同角度拍摄物体,以获取丰富的外观信息

    立体视觉重建:基于双目或多目视觉原理来恢复物体的三维结构

    纹理映射:将采集的图像纹理映射到三维模型,体现纹理细节

  • fenjicunchu

    Mesh网格Tiered Storage

    点云三角化:从三维点云数据生成Mesh网格

    Mesh 优化:为了提高渲染效率需要对 Mesh 网格进行简化

    纹理坐标生成:为了将二维纹理图像映射到三维上,设置每个顶点计算理坐标

智能表情驱动

  • 20210302145620_40722.png

    表情识别Facial Expression Recognition

    卷积神经网络:卷积层通过卷积核在图像上滑动进行特征提取

    视觉与音频融合:采集视觉信息,语音中的情感线索辅助表情识别

    模型预训练:利用预训练模型提高模型的训练效率和泛化能力

  • 表情生成Expression Generation

    渐进式生成对抗网络:逐步提高生成图像的质量,使得表情更加逼真

    有限元模型:建立有限元模型模拟人脸肌肉变化对皮肤变形的影响

    语音-表情映射模型:建立语音与表情的映射关系,预测相应的表情

  • 智能表情迁移Intelligent Expression Transfer

    基于深度学习映射:通过对抗网络来学习源表情和目标表情之间的映射关系

    泊松融合:通过求解泊松方程来实现图像的融合,保持融合的连续性

    特征解耦与重建:在表情迁移中只对表情进行操作,而保留身份特征不变

AI实时肌肉驱动

  • 20210302145620_40722.png

    肌肉运动建模Muscle Motion Modeling

    通过大量的训练数据,实现对肌肉运动的实时预测和驱动

    通过对肌肉的收缩、拉伸等运动进行数学建模

  • 传感器采集Sensor Acquisition

    肌电传感器:用于测量肌肉电活动的传感器

    运动传感器:提供更全面的身体运动数据

  • 人机交互Human-Machine Interaction/em>

    通过分析传感器数据和用户的行为模式,推断出用户的运动意图

    语音交互、手势交互等技术集成到交互系统系统

核心技术全景图

产品案例

  • 虚幻舱

    是一款融合了AI数字技术与3D全息技术的智能交互设备,内置行业领先的AI大模型与虚拟人交互系统,真正实现虚拟数字人与真实人类的"面对面"交互。

    阅读案例
  • 电子相册

    上传一张图片或视频,即可生成生动的数字视频,通过先进的A1模型训练,便能立即见证您的瞬间"活"起来

    阅读案例
  • 智拍

    智拍采用先进的面部识别技术和3D模型,能够精准地识别用户面部特征,并将其融合到卡通形象中,实现逼真、生动的换脸效果

    阅读案例
  • 智行大模型

    自主开发的AI大模型,结合计算机视觉、语音克隆技术,实现高精度数字人生成、实时互动与多语言处理,支持复杂场景的智能化需求

    阅读案例