与#模态#相关的内容 - PmDaddy

全部分类数据库前端云计算

服装行业多模态算法个性化产品定制方案

本文是想利用AI赋能服装设计师，设计好看、好穿、好卖的服装，利用GPT+数据洞察、柔性快反+数智化供应链以及AIGC降低设计门槛和库存成本，快速反应市场时尚流行趋势，并进行落地实践

为视觉语言多模态模型进行偏好优化

为视觉语言多模态模型进行偏好优化训练模型使得它能够理解并预测人类偏好是一项比较复杂的任务。诸如 SFT (Supervised finetuning) 的传统的方法一般都需要耗费较大成本，因为这些算法需要对数据打上特定的标签。而偏好优化 (Preference Optimization) 作为一种

视觉语言跨模态特征语义相似度计算改进--表征空间维度语义依赖感知聚合算法 ACM MM

论文链接：Unlocking the Power of Cross-Dimensional Semantic Dependency for Image-Text Matching (ACM MM23) 代码主页：https://github.com/CrossmodalGroup/X-Dim 主要优

DashVector + DashScope升级多模态检索

本教程在前述教程（DashVector + ModelScope玩转多模态检索）的基础之上，基于DashScope上新推出的ONE-PEACE通用多模态表征模型结合向量检索服务DashVector来对多模态检索进行升级，接下来我们将展示更丰富的多模态检索能力。 DashVector + ModelS

JQuery 弹出模态窗口

一文详解多模态认知智能

摘要：多模态认知智能是AI人工智能当前发展的主流趋势之一，其核心是以多模态知识的获取，表示与推理为主要内容的跨模态知识工程与认知智能，也是为了更好的处理多模态的数据，需要融合多种感知模态和智能处理技术。本文分享自华为云社区《GPT-4发布，AIGC时代的多模态还能走多远？系列之三：多模态认知智能》

浅析AIGC for MMKG

摘要：AIGC和多模态知识图谱（MMKG）中的知识获取又是怎么实现的呢？他们之间有什么关联呢？本文分享自华为云社区《GPT-4发布，AIGC时代的多模态还能走多远？系列之四 AIGC for MMKG》，作者：码上开花_Lancer。与传统知识图谱不同，MMKG以多模态数据作为源头，从多方面描述

解密Prompt系列33. LLM之图表理解任务-多模态篇

这一章我们聚焦多模态图表数据。先讨论下单纯使用prompt的情况下，图片和文字模态哪种表格模型理解的效果更好更好，再说下和表格相关的图表理解任务的微调方案

带你读AI论文丨针对文字识别的多模态半监督方法

摘要：本文提出了一种针对文字识别的多模态半监督方法，具体来说，作者首先使用teacher-student网络进行半监督学习，然后在视觉、语义以及视觉和语义的融合特征上，都进行了一致性约束。本文分享自华为云社区《一种针对文字识别的多模态半监督方法》，作者： Hint 。摘要直到最近，公开的真实场

《最新出炉》系列初窥篇-Python+Playwright自动化测试-16-处理模态对话框弹窗

1.简介我们在日常工作中，会经常遇到弹出警告框的问题，弹框无法绕过，必须处理才可以执行后续的测试，所以弹框处理也是我们必须掌握的一个知识。宏哥在java+selenium系列文章中介绍过这部分内容。那么，playwright对于弹框的处理是怎样的？是否比selenium更加简单呢？下面我们就来介绍

LLM 大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践

LLM 大模型学习必知必会系列(三)：LLM和多模态模型高效推理实践 1.多模态大模型推理 LLM 的推理流程：多模态的 LLM 的原理：代码演示：使用 ModelScope NoteBook 完成语言大模型，视觉大模型，音频大模型的推理环境配置与安装以下主要演示的模型推理代码可在魔搭社区免

Idefics2 简介: 为社区而生的强大 8B 视觉语言模型

我们很高兴在此发布 Idefics2，这是一个通用的多模态模型，接受任意文本序列和图像序列作为输入，并据此生成文本。它可用于回答图像相关的问题、描述视觉内容、基于多幅图像创作故事、从文档中提取信息以及执行基本的算术运算。 Idefics2 由 Idefics1 改进而得，其参数量为 8B，具有开放许

解密Prompt系列32. LLM之表格理解任务-文本模态

这一章我们聊聊大模型表格理解任务，在大模型时代主要出现在包含表格的RAG任务，以及表格操作数据抽取文本对比等任务中。这一章先聊单一的文本模态，我们分别介绍微调和基于Prompt的两种方案。

解密Prompt系列30. LLM Agent之互联网冲浪智能体

这一章介绍自主浏览操作网页的WebAgent和数据集：初级MiniWoB++，高级MIND2WEB，可交互WEBARENA，多模态WebVoyager，多轮对话WebLINX，复杂AutoWebGLM

AI时代你一定要知道的Agent概念

这两年，随着人工智能（AI）和计算能力的发展，AI应用的落地速度大大加快。以ChatGPT为代表的AI应用迅速火遍全球，成为打工人的常用工具。紧接着，多模态、AI Agent等各种高大尚的名词也逐渐进入大众视野，吸引了大量关注。那么，到底什么是AI Agent？下文半支烟将带你详细了解这个概念。 1

【重磅】华为云盘古大模型5.0，正式发布！

2024年6月21日，在华为开发者大会2024（HDC 2024）上，华为常务董事、华为云CEO张平安正式发布盘古大模型5.0，在全系列、多模态、强思维三个方面全新升级；张平安还分享了盘古大模型在自动驾驶、工业设计、建筑设计、具身智能、媒体生产和应用、高铁、钢铁、气象等领域的丰富创新应用和落地实践，

GPT-4多态大模型研究

1.概述 GPT-4是OpenAI最新的系统，能够产生更安全和更有用的回应。它是一个大型的多模态模型（接受图像和文本输入，输出文本），在各种专业和学术的基准测试中展现了人类水平的表现。例如，它在模拟的律师资格考试中得分位于前10%的考生之列；相比之下，GPT-3.5的得分位于后10%。 GPT-4是

AI识别检验报告 -PaddleNLP UIE-X 在医疗领域的实战

[TOC] # UIE-X在医疗领域的实战 **PaddleNLP全新发布UIE-X 🧾，除已有纯文本抽取的全部功能外，新增文档抽取能力。** UIE-X延续UIE的思路，**基于跨模态布局增强预训练模型**[文心ERNIE-Layout](https://github.com/PaddlePad

AIGC时代：未来已来

摘要：人工智能的快速发展使得我们进入了AIGC时代。AIGC时代的到来，将会带来巨大的机遇和挑战。本文分享自华为云社区《GPT-4发布，AIGC时代的多模态还能走多远？系列之一： AIGC时代：未来已来》，作者： ModelArts 开发。人工智能的快速发展使得我们进入了AIGC时代，即人工智

带你上手基于Pytorch和Transformers的中文NLP训练框架

基于pytorch、transformers做中文领域的nlp开箱即用的训练框架，提供全套的训练、微调模型（包括大模型、文本转向量、文本生成、多模态等模型）的解决方案。

首页
上一页
1
2
3
4
5
6
7
8
9
10
下一页
尾页

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化