金融大模型落地新挑战

金融,模型,落地,挑战 · 浏览次数 : 10

小编点评

## 外滩大会 | 金智塔科技首席科学家郑小林教授出席大会探讨金融大模型落地新挑战大模型的构建非常依赖算力、算料,对高校而言,从模型合规性、隐私保护的角度去做研究是很好的切入点。 **主要内容:** * 外滩大会是金融科技领域的年度盛会,金智塔科技首席科学家郑小林教授出席了该大会并发表了演讲。 * 郑教授强调,金融大模型落地需要考虑算力、算料、隐私保护等多个方面。 * 传统的联邦学习(FL)和多方安全计算(MPC)如何融入大模型面临巨大的挑战,而可信执行环境(TEE)的方式也碰到芯片的限制。 * 隐私计算可用在大模型的数据的预训练,数据收集针对金融大模型在落地实施中的挑战。 * 隐私保护问题是金融大模型落地实施过程中的主要挑战。 * 郑教授提出了三个思考角度: * 用户角度:如何确保用户数据的安全性,如何保存模型数据,如何防止恶意输入与事实不相符的内容? * 平台拥有方角度:平台如何评估模型安全? * 应用角度:如何防止模型结果有偏差,如何控制误差累积,从而导致金融安全问题? **总结:** 金融大模型落地需要考虑算力、算料、隐私保护等多个方面,而隐私保护问题是其主要挑战。隐私计算可用在大模型的数据的预训练,但该问题需要进一步研究解决。

正文

文章学习:外滩大会 | 金智塔科技首席科学家郑小林教授出席大会探讨金融大模型落地新挑战

大模型的构建非常依赖算料、算力,对高校而言,从模型合规性、隐私保护的角度去做研究是很好的切入点。依托浙大科研团队,金智塔科技在大模型的研究中发现绝大多数的数据都分布在客户手中,比如金融机构场景建设需要用到政务数据,在运营商无法聚集这部分数据、金融数据也无法给予对方的现实情况下,如何训练金融大模型?传统的联邦学习(FL)和多方安全计算(MPC)如何融入大模型?这两点在性能和通讯上面临巨大的挑战,而用可信执行环境(TEE)的方式也会碰到芯片的限制,郑教授表示这些问题一旦解决,金融大模型落地便未来可期。

隐私计算可用在大模型的数据的预训练,数据收集

针对金融大模型在落地实施中的挑战,郑教授表示最大的挑战依然是安全与合规。他提出了三个思考角度:

1、用户角度。在金融机构做模型训练的时候,如何确保用户数据的安全性,金融数据和用户数据分别如何保存,模型是否可以在机构内部私有化部署,外部数据又如何融入进来,这些是需要去思考的;

用户数据安全问题

2、平台拥有方角度。平台拥有方需要评估模型安全。模型本身是否会被攻击,模型训练的语料在交互的时候是否被恶意输入与事实不相符的内容;另一方面,模型代表了知识产权,如何去开放,在底层模型越来越趋同的情况下,不同的行业训练出来的特征去做开放是否会被窃取;

模型安全问题和知识产权问题

3、应用角度。金融大模型与普通模型不同之处在于,金融业务各环节的决策是不允许存在偏差的,一旦模型结果有偏差,就意味着用户的资金可能亏损,这里我们需要思考,基于金融大模型训练过程中的很多非线性运算,是否会产生大量误差,而误差是否会被累积,从而变成巨大的金融安全问题。

误差问题

所以不管从个人、平台方还是监管方,都要关注金融大模型落地实施过程中的数据安全问题。

郑教授指出,传统AI分为三个阶段,从计算到感知再到认知,认知智能是最高阶段。也许当GPT迭代到第10代就可以覆盖全人类的智慧,这意味着人类的学习方式和知识获取方式也将做出相应改变,当AI达到顶峰,人类将来的发展空间会在哪里?知识和智能的涌现从历史来看都是瞬间发生,郑教授认为,人类和AI很大的区别在于,人类一直在学习“学习的能力”,并且拥有这项能力。未来,人类和AI并不是必须互相被替代,而是基于AI来强化人类自身的能力,最终达到人机协同,但又以人为本的共生状态。

与金融大模型落地新挑战相似的内容:

金融大模型落地新挑战

文章学习:外滩大会 | 金智塔科技首席科学家郑小林教授出席大会探讨金融大模型落地新挑战 大模型的构建非常依赖算料、算力,对高校而言,从模型合规性、隐私保护的角度去做研究是很好的切入点。依托浙大科研团队,金智塔科技在大模型的研究中发现绝大多数的数据都分布在客户手中,比如金融机构场景建设需要用到政务数据

金域医学2023“域见杯”医检人工智能开发者大赛正式启动

摘要:6月27日, 2023“域见杯”医检人工智能开发者大赛正式启动。 本文分享自华为云社区《金域医学2023“域见杯”医检人工智能开发者大赛正式启动》,作者:HWCloudAI 。 人工智能与大模型开发迎来“新风口”,AIGC(生成式AI)技术正在重构各行各业。为培养交叉复合型人才,构建智慧医检新

大语言模型的开发利器langchain

[toc] # 简介 最近随着chatgpt的兴起,人工智能和大语言模型又再次进入了人们的视野,不同的是这一次像是来真的,各大公司都在拼命投入,希望能在未来的AI赛道上占有一席之地。因为AI需要大规模的算力,尤其是对于大语言模型来说。大规模的算力就意味着需要大量金钱的投入。那么对于小公司或者个人来说

看华为云Serverless 4大特性如何让软件架构更丝滑

摘要:Serverless可以看作是一种云计算服务模型,它允许开发者在不需要管理服务器的情况下通过事件驱动的方式运行应用代码。 软件架构的发展从原先的单体架构到近十几年的微服务架构,再到现在新兴的Serverless架构。单体架构通常把应用的逻辑和功能耦合在一起,部署在BMS裸金属机或VM上,耦合模

算法金 | 详解过拟合和欠拟合!性感妩媚 VS 大杀四方

大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」 今天我们来战 过拟合和欠拟合,特别是令江湖侠客闻风丧胆的 过拟合,简称过儿, Emmm 过儿听起来有点怪怪的 1. 楔子 机器学习模型是一种能够从数据中学习规律并进行预测的算法。我们希望

李沐:用随机梯度下降来优化人生!

大侠幸会,在下全网同名「算法金」 0 基础转 AI 上岸,多个算法赛 Top 「日更万日,让更多人享受智能乐趣」 今天我们来聊聊达叔 6 大核心算法之 —— 优化 算法。吴恩达:机器学习的六个核心算法! 梯度下降优化算法是机器学习和深度学习中最常用的优化算法之一。它通过不断调整模型参数,使得损失函数

前后端结合解决Excel海量公式计算的性能问题

背景 在数据密集的业务领域,尤其是金融,保险,税务等行业中,经常需要利用Excel模型,来对业务进行分析和处理。例如: 1.金融投资: 根据模型进行估值计算,并对投资风险进行评估,通过测算出投资的内部收益率(IRR),净现值(NPV)来做投资收益分析,反应项目的获利能力。 2.保险精算: 运用数学,

全面数字化时代,国有大型银行如何走好金融创新之路?

摘要:在金融创新压力下,传统集中式数据库的短板逐渐凸显出来,唯有加速核心系统的升级和转型,将应用迁移到更具有可持续演进支撑能力的数据库上,才能解决根本问题。 本文分享自华为云社区《全面数字化时代,国有大型银行如何走好金融创新之路?》,作者:GaussDB 数据库。 近些年来,金融行业数字化转型不断推

[转帖]Redis检索性能不足,改造rsbeat解决历史慢日志跟踪

https://www.sohu.com/a/313061840_411876 作者介绍 刘宇,甜橙金融创新中心基础技术架构师,拥有9年IT从业经验、9年数据库开发运维经验、4次大型营销活动经验。目前关注容器、分布式数据库技术等基础技术。 在线上排查redis性能问题时,从redis中找进行优化是一

回测收益170%的趋势交易策略——《基于模糊理论的趋势交易-王立新》论文精读

这篇论文2014年发布在SCI一区,共3篇,作者是师承模糊集之父Zadeh的王立新教授(西安交通大学),论文的贡献在于把金融领域模糊的表达转变为模糊集(fuzzy sets)和隶属函数(membership),先看回测展示: 图中上图绿线表示买入并持有,红线表示卖出。下图是系数值,绿色代表买方力量值