推荐一枚宝藏Up主,顺便聊聊感想

up · 浏览次数 : 10

小编点评

【B站宝藏Up主】新石器公园,理工科领域科普视频推荐 大家好,我是来自B站的【新石器公园】,一个专注于科普的宝藏Up主。我的视频主题涵盖了大模型的底层算法、量子计算底层原理、硬件设计等自然科学领域,帮助观众更好地理解这些复杂概念。 从去年开始,大模型爆发,产业界跟进落地速度加快。然而,大多数开发人员更关注上层使用,而底层细节关注较少。为了帮助大家更好地理解底层技术,我制作了一系列科普视频,涵盖以下问题: 1. 大模型的参数是什么?与传统的神经网络有何不同? 2. transformer的自注意力机制是什么? 3. 扩散模型底层原理是怎样的?大模型如何生成视频? 同时,我还会分享一些与底层技术相关的拓展知识,如室温超导技术、量子计算机、忆阻器等。这些知识可以帮助我们更好地理解世界,拓宽视野。 此外,我还关注大模型在工业、计算机业界的应用和评价体系等方面的问题。希望通过我的视频,能够帮助大家更好地掌握知识体系,提升认知水平。 总之,【新石器公园】的科普视频适合对底层技术感兴趣的观众观看。希望大家能够从中受益,共同探索这个充满奥秘的世界。 如果你觉得这篇文章对你有所帮助,请点个赞支持一下!如果你有其他问题或想法,欢迎在评论区留言交流。

正文

众所周知,B站是学习网站😄

最近发现一宝藏Up主,主要做科普,主题包括但不限于:大模型的底层算法、量子计算底层原理和硬件设计,以及其他物理或者自然科学主题,总体偏向于理工科。

值得推荐的理由:Up主对底层技术的了解非常透彻,因此举的例子也非常生动(即使如傅里叶变换这类复杂的数学公式,也能用生活中的例子类比)。

Up主的名字:新石器公园

 

推荐一看。

 

接下来聊聊感想

我是怎么发现这枚宝藏Up主的呢?

源于最近使用metaso.cn搜了一下2024年热点研究方向:


然后挑了几个计算机领域比较相近的研究方向,挨个儿去B站搜索相关领域的视频,顺其自然就找到啦,然后科普视频就看得停不下来,感触比较深的是:

 

从去年开始,大模型爆发,很明显的一个现象是,随着国内相关政策的不断完善,开源生态也越来越成熟,产业界的跟进落地速度与也越来越快,相关的产品层出不穷。不过,大多数开发人员更关注上层使用,而对底层的细节关注比较少,比如下面几个问题看看你是否能够回答:

1. 大模型的参数是指什么?它和传统的神经网络有什么不同?

2. transformer的自注意力机制是指什么?

3. 扩散模型底层原理是怎样的?大模型为什么能生成视频?

 

向下扩展到底层技术:

1. 之前频频上新闻的室温超导技术,究竟有啥用?

2. 量子计算机是科学还是玄学?它如何提高计算效率?又会与大模型擦出怎样的火花?

3. 忆阻器与常见的模电器件有何不同?

 

这些问题,在Up主的科普视频都有解答,对于概念理解而言,是非常好的入门渠道。如果你说,这和我有啥关系?这难道不是科学家要关心的嘛?那向上扩展到应用层,看看以下问题你能否回答:

1. 大模型在工业中是如何发挥作用的?比如之前华为用在了采矿,现在又用在了炼钢,究竟是怎么做的?

2. 大模型在计算机业界,最常用的架构是怎样的?除了RAG,还有其他形式吗?大模型效果评价体系有哪些?

3. 内容向量化是指什么?维度又是什么含义?选取多少维度比较合适?

4. 文本的语义切分怎么做,才能保证效果最优?传统的chunk+overlap是否还有优化空间?用大模型直接做语义切分怎么样?

5. prompt调优有哪些手段?如何评估它们的效果?

 

是不是发现很多知识明明用了,但是不清楚背后的原理?或者知道原理但不知道如何表达出来?

其实,这都属于知识体系构建不完整的一种体现,很多知识都是一个个孤岛,没有连点成线,更别提连线成面了。

所以,我们要做的是:

1. 在工作之余,花点时间了解平时用到的技术底层原理,慢慢提升认知。这是向下扎根的过程;

2.多关注行业发展趋势,多接触业务领域人员,了解他们对于技术演化趋势的看法,这也很重要,往往决定了技术是否能够搭载产品被推广出去。这是向上生长的过程。

 

既然谈到了知识体系的构建,那就

再聊聊信息收集和处理的方法

最近逛知乎偶然看到的一个话题:

 

 

 

于是有幸拜读了回答的一篇长文,该文从各种角度分析了信息的获取、处理以及分析方式,具体可以去知乎查看,本文不再展开。

 

还有一本北大博士论文神作,名叫《中县干部》,网上有资源,可以学习下。

 

总体而言,可以理解为文章讲述了一套概念:找到渠道、了解各类实体、获取各类实体之间的交互关系,并持续关注实体交互关系的动态变化。这与计算机科学中常常提到的知识图谱或者图数据库的构建和更新操作非常相似。

 

你看,这个世界的很多东西都是相通的,所以多多思考,任督二脉就慢慢打通了。

 

时间有限,今天就先聊到这里吧,希望能给大家带来一些启发。

与推荐一枚宝藏Up主,顺便聊聊感想相似的内容:

推荐一枚宝藏Up主,顺便聊聊感想

众所周知,B站是学习网站 最近发现一宝藏Up主,主要做科普,主题包括但不限于:大模型的底层算法、量子计算底层原理和硬件设计,以及其他物理或者自然科学主题,总体偏向于理工科。 值得推荐的理由:Up主对底层技术的了解非常透彻,因此举的例子也非常生动(即使如傅里叶变换这类复杂的数学公式,也能用生活中的

[转帖]数据中心NVMe SSD进入PCle5.0阶段

http://blog.itpub.net/31545803/viewspace-2928567/ 当PCle4.0产品正战得酣畅淋漓,属于下一个时代的PCle5.0悄然走来。从去年下半年开始,除了一些国际大厂纷纷推出新品,以宝存科技为代表的国内SSD厂商也在紧跟趋势,部署下一个赛道。 SSD固态硬

推荐一款Python接口自动化测试数据提取分析神器!

1、引言 在处理JSON数据时,我们常常需要提取、筛选或者变换数据。手动编写这些操作的代码不仅繁琐,而且容易出错。Python作为一个功能强大的编程语言,拥有丰富的库和工具来处理这些数据。今天,将介绍一个实用的Python库——JMESPath,它为提取JSON数据提供了简洁而强大的语法。 2、JM

推荐一款基于业务行为驱动开发(BDD)测试框架:Cucumber!

大家好,我是狂师。 今天给大家介绍一款行为驱动开发测试框架:Cucumber。 1、介绍 Cucumber是一个行为驱动开发(BDD)工具,它结合了文本描述和自动化测试脚本。它使用一种名为Gherkin的特定语言来描述应用程序的行为,这种语言非常接近自然语言,使得非技术人员也能够理解和参与测试。 知

推荐一款模拟浏览器自动化操作神器!Mechanize

大家好,我是狂师! 今天给大家推荐一款用于模拟浏览器行为以进行网页自动化操作Python库:Mechanize。 1、介绍 Mechanize是Python中的一个库,它被设计用来自动化网页浏览和数据提取任务。 通过模拟真实浏览器的行为,如填写表单、点击链接、处理Cookie等,Mechanize使

推荐一款微信公众平台Python开发神器!

1、引言 在当今数字化时代,微信公众平台成为了企业和个人连接用户的重要渠道。为了高效地管理和与用户互动,开发者需要一个强大而灵活的工具。 Weixin-Python 正是这样一个为微信公众平台量身打造的 Python 库,它以其简洁的 API 和丰富的功能赢得了众多开发者的青睐。本文将深入探讨 We

推荐一个好用的.net开发框架

企业应用开发平台(Enterprise Develop Platform),以下简称EDP。EDP是一套集完整组织架构,全面权限体系,以及各类基础功能于一体的基于.net的企业应用开发平台。其最大的特点是将复杂的数据行列权限的实现通过简单且友好的编码方式面向开发人员,同时EDP还提供了全面的系统基础

推荐一款 .NET 编写的 嵌入式平台的开源仿真器--Renode

Renode 是一个开发框架,通过让你模拟物理硬件系统来加速物联网和嵌入式系统开发。 Renode 可以模拟 Cortex-M、RISC-V 等微控制器,不仅可以模拟 CPU指令,还可以模拟外设,甚至可以模拟板载的外设。 更强的是,它可以让你在你的 PC 上运行、调试和测试未经修改的嵌入式软件-从裸

推荐一款采用 .NET 编写的 反编译到源码工具 Reko

今天给大家介绍的是一款名叫Reko的开源反编译工具,该工具采用C#开发,广大研究人员可利用Reko来对机器码进行反编译处理。我们知道.NET 7 有了NativeAOT 的支持,采用NativeAOT 编译的.NET程序 无法通过ILSpy 之类的传统工具得到源码,这款Reko 可能是唯一一款可以把

推荐一款 在线+离线数据 同步框架 Dotmim.Sync

移动智能应用可以分为在线模式、纯离线模式与“在线+离线”混合模式。在线模式下系统数据一般存储在服务器端的大中型数据库(如 SQL Server、Oracle、MySQL 等),移动应用依赖于稳定可靠的网络连接;纯离线模式下系统数据一般存储在移动终端的轻量级数据库(如 SQLite等),移动应用不需要