碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」

碉堡,万物,可分,标记,模型,上线,github,热点 · 浏览次数 : 1177

小编点评

**周内特推项目** **1. 1.1 AI 专场** * 新发布,但已在 14 天内获得 18k+ 的 star。 **2. 2.1 Meta 开源构建系统:buck2** * 新版本,但已在 14 天内获得 500+ 的 star。 **3. 2.3 流处理:arroyo** * 新版本,但已在 700+ 的 star。 **4. 3.1 极简输入法:rime-ice** * 新版本,但已在 1,850+ 的 star。 **5. 3.5 向量数据库:weaviate** * 新版本,但已在 500+ 的 star。 **6. 3.1 GIF 录屏工具:ScreenToGif** * 新版本,但已在 3,100+ 的 star。 **7. 3.1 GIF 录屏工具:nginx-proxy-manager** * 新版本,但已在 14 天内获得 43,000+ 的 star。

正文

这周有个让人眼前一亮的图像识别模型 segment-anything,它能精细地框出所有可见物体,它标记出的物体边界线清晰可见。如此出色的模型,自然获得了不少人的赞赏,开源没几天,就拿下了 18k+ 的 star,而上周开源不到 48 小时获得 35k+ star 的推特推荐算法,本周也成功突破 50k+ 关卡。

依旧是 AI 热度不减的一周,本周的 AI 专场收录了一个离线生图工具,以及一个自托管 AI 编程助手。此外,还有 Meta 开源出来的重构版构建系统 buck2 也是大受欢迎,还有随着各类 AI 工具火起来的向量数据库,weaviate 也小小地展露了下头角。

还有比较少见的工具类应用,一款极简的输入法 rime-ice 也值得一看。

以下内容摘录自微博@HelloGitHub 的 GitHub Trending 及 Hacker News 热帖(简称 HN 热帖),选项标准:新发布 | 实用 | 有趣,根据项目 release 时间分类,发布时间不超过 14 day 的项目会标注 New,无该标志则说明项目 release 超过半月。由于本文篇幅有限,还有部分项目未能在本文展示,望周知 🌝

  • 本文目录
    • 1. 本周特推
      • 1.1 AI 专场
      • 1.2 Meta 开源构建系统:buck2
    • 2. GitHub Trending 周榜
      • 2.1 嵌入式数据库:chroma
      • 2.2 万物皆可分:segment-anything
      • 2.3 流处理:arroyo
      • 2.4 极简输入法:rime-ice
      • 2.5 向量数据库:weaviate
    • 3. HelloGitHub 热评
      • 3.1 GIF 录屏工具:ScreenToGif
      • 3.2 Nginx 可视化管理平台:nginx-proxy-manager
    • 4. 往期回顾

1. 本周特推

1.1 AI 专场

在这波 AI 热度消退之前,热点趋势的特推部分会增加一个模块来分享新的 AI 应用。

macOS 跑 SD:MochiDiffusion

主语言:Swift

New MochiDiffusion 内置 Apple 的 Core ML Stable Diffusion 框架,以实现在搭载 Apple 芯片上用极低的内存占用发挥出模型最优性能。部分特性:

  • 可离线生图
  • 高性能,极低的内存占用
  • 图转图,Image2Image
  • 自定义 Stable Diffusion Core ML 模型
  • 无需担心损坏模型

GitHub 地址→https://github.com/godly-devotion/MochiDiffusion

自托管 AI 编程助手:tabby

主语言:Python、TypeScript

New 自托管的 AI 编程助手,可作为 Copilot 的替代品。特性:

  • 无需数据库和云服务;
  • 具有可视化、配置模型和 MLOps 的 Web 界面;
  • 接入 OpenAPI;
  • 消费级别的 GPU 支持(用不同方法优化的 FP-16 权重加载)

GitHub 地址→https://github.com/TabbyML/tabby

1.2 Meta 开源构建系统:buck2

主语言:Rust

Meta 开源的大规模构建系统 buck2 继承于 buck1,但是不同于 buck1 采用 Java 编写,buck2 由 Rust 编写而成。重构 buck1 的想法源自想要提供更快速、更高效的构建服务,buck2 有以下特性:

  • 解耦特定语言规则,buck2 的核心构建系统没有任何特定的语言规则,这意味着它有更好的可扩展性。buck2 核心部分用 Rust 编写,语言规则部分(例如:如何构建 C++)由 Starklark 编写;
  • 构建系统由单一增量依赖图提供支持,由此消减多类 bug 并增加并发性;
  • 规则 API 的设计主要为提供先进的性能特性,以及动态依赖特征;
  • 集成远程执行,能在远程机器执行操作,它采用了同 Bazel 一样的 API,并已经用 Buildbarn 和 EngFlow 进行远程执行测试;
  • 集成虚拟文件系统,不用整仓检测,按需获取文件即可;

GitHub 地址→https://github.com/facebook/buck2

2.1 嵌入式数据库:chroma

本周 star 增长数:1,200+主语言:Python、TypeScript

Chroma 是一个用于 Python / JavaScript LLM 应用程序的嵌入式数据库,它具有内存快速访问的优势。它只有 4 个核心函数:

import chromadb
# setup Chroma in-memory, for easy prototyping. Can add persistence easily!
client = chromadb.Client()

# Create collection. get_collection, get_or_create_collection, delete_collection also available!
collection = client.create_collection("all-my-documents") 

# Add docs to the collection. Can also update and delete. Row-based API coming soon!
collection.add(
    documents=["This is document1", "This is document2"], # we handle tokenization, embedding, and indexing automatically. You can skip that and add your own embeddings as well
    metadatas=[{"source": "notion"}, {"source": "google-docs"}], # filter on these!
    ids=["doc1", "doc2"], # unique for each doc 
)

# Query/search 2 most similar results. You can also .get by id
results = collection.query(
    query_texts=["This is a query document"],
    n_results=2,
    # where={"metadata_field": "is_equal_to_this"}, # optional filter
    # where_document={"$contains":"search_string"}  # optional filter
)

GitHub 地址→https://github.com/chroma-core/chroma

2.2 万物皆可分:segment-anything

本周 star 增长数:18,000+主语言:Jupyter Notebook

New 这个代码库提供了使用 SegmentAnything 模型(SAM)进行推理的代码,SAM 是一种输入诸如点、框等 prompt 生成高质量目标 mask 的模型,它有非常出彩的标记效果。btw,项目开源不到一周已经有 18k+ star。

GitHub 地址→https://github.com/facebookresearch/segment-anything

2.3 流处理:arroyo

本周 star 增长数:700+主语言:Rust、TypeScript

New arroyo 是一个 Rust 编写的分布式流处理引擎,旨在高效地对流数据进行状态计算。与传统的批处理不同,流处理引擎可以处理有界和无界数据源,一旦结果可用就立即输出。

GitHub 地址→https://github.com/ArroyoSystems/arroyo

2.4 极简输入法:rime-ice

本周 star 增长数 1,850+主语言:Go、Lua

雾凇拼音一个极简风的输入法,支持简体、全拼、双拼。值得一提的事,作者自己维护了一个词库:

  • 8105 字表
  • base 基础词库
  • sogou 搜狗流行词
  • ext 扩展词库,小词库
  • tencent 扩展词库,大词库
  • Emoji

GitHub 地址→https://github.com/iDvel/rime-ice

2.5 向量数据库:weaviate

本周 star 增长数:500+主语言:Go

Weaviate 是一个开源的向量数据库,可以存储对象和向量,允许将向量搜索与结构化过滤相结合,并具有云原生数据库的容错性和可扩展性,可通过 GraphQL、REST 和各种语言客户端进行访问。

GitHub 地址→https://github.com/weaviate/weaviate

3. HelloGitHub 热评

在这个章节,我们将会分享下本周 HelloGitHub 网站上的热评项目,HG 开源项目评价体系刚上线不久,期待你的评价 😄

3.1 GIF 录屏工具:ScreenToGif

主语言:C#

一款 Windows 上的免费 GIF 录屏工具,易安装、好上手,支持录制指定区域画面,且可以将视频导出为 gif 等文件格式。

HG 评价地址→https://hellogithub.com/repository/b49e4c9dd1834dc1b9f3352c89ef0239

3.2 Nginx 可视化管理平台:nginx-proxy-manager

主语言:JavaScript

它开箱即用,支持 Docker 一键部署,可以让用户通过 Web 界面在线配置、管理 Nginx 服务,支持转发、重定向、SSL 证书、高级配置等功能。

HG 评价地址→https://hellogithub.com/repository/43d04968e8ed4bdfae28023b1c450291

4. 往期回顾

往期回顾:

以上为 2023 年第 14 个工作周的 GitHub Trending 🎉如果你 Pick 其他好玩、实用的 GitHub 项目,来 HelloGitHub 和大家一起分享下哟 🌝

HelloGitHub 交流群现已全面开放,添加微信号:HelloGitHub001 为好友入群,可同前端、Java、Go 等各界大佬谈笑风生、切磋技术~

与碉堡!“万物皆可分”标记模型上线「GitHub 热点速览」相似的内容: