跳到主要内容

38 篇博文 含有标签「AI」

查看所有标签

Falcon-Perception

· 阅读需 1 分钟
GoCoding

Falcon Perception: a natively multimodal, dense, autoregressive Transformer model that performs object detection, instance segmentation, or OCR from natural language queries.

Falcon Perception: 一种原生多模态、稠密自回归的 Transformer 模型,能够根据自然语言查询执行目标检测、实例分割或 OCR 任务。

https://github.com/tiiuae/Falcon-Perception

Sapiens2

· 阅读需 1 分钟
GoCoding

Sapiens2: 1K resolution vision transformers pretrained on 1B human images.

  • for human-centric tasks: pose estimation, body-part segmentation, surface normals, and pointmaps.

Sapiens2: Meta AI 提出的人体中心的视觉基础模型。

  • 10亿张人体图像预训练,参数量 0.1B~5B,原生支持 1K 分辨率(4K 变体支持超高清)
  • 任务:姿态估计、人体部位分割、表面法线、点图

https://github.com/facebookresearch/sapiens2

GitNexus

· 阅读需 1 分钟
GoCoding

GitNexus is a client-side knowledge graph creator that runs entirely in your browser. Perfect for code exploration.

GitNexus 是一个完全在浏览器中运行的客户端知识图谱生成器,非常适合代码探索。

https://github.com/abhigyanpatwari/GitNexus

Andrej Karpathy Skills

· 阅读需 2 分钟
GoCoding

A single CLAUDE.md file to improve Claude Code behavior, derived from Andrej Karpathy's observations on LLM coding pitfalls.

一个单一的 CLAUDE.md 文件,用于改善 Claude Code 的行为,源自 Andrej Karpathy 的观察 关于 LLM 编码陷阱的总结。

https://github.com/forrestchang/andrej-karpathy-skills

Andrej Karpathy: AI 研究科学家,OpenAI 创始成员,特斯拉前 AI 高级总监(领导 Autopilot 计算机视觉团队),斯坦福 CS231n 联合创建者

Matt Pocock Skills

· 阅读需 2 分钟
GoCoding

Agent Skills for real engineers. Straight from Matt Pocock's .claude directory.

一个面向真正工程师的 Agent 技能。直接来自 Matt Pocock 的 .claude 目录。

https://github.com/mattpocock/skills

Matt Pocock: TypeScript 布道师,Total TypeScript 创始人,曾就职于 Vercel 和 Stately.ai。

CC Switch

· 阅读需 1 分钟
GoCoding

CC Switch: The All-in-One Manager for Claude Code, Codex, Gemini CLI, OpenCode & OpenClaw.

CC Switch: Claude Code, Codex, Gemini CLI, OpenCode 和 OpenClaw 的全方位管理工具。

https://github.com/farion1231/cc-switch

Rex-Omni

· 阅读需 1 分钟
GoCoding

Rex-Omni is a 3B-parameter multimodal model that unifies visual perception tasks, including object detection, OCR, pointing, keypointing, and visual prompting into a single next point prediction framework.

Rex-Omni 是一个 3B 参数多模态模型,它将视觉感知任务(包括物体检测、OCR、指向、关键点定位和视觉提示)统一到一个单一的下一点预测框架中。

gstack

· 阅读需 1 分钟
GoCoding

gstack: turns Claude Code into a virtual engineering team.

gstack: 将 Claude Code 变成一个虚拟工程团队,让一个人就可以用它来创造与交付软件。

https://github.com/garrytan/gstack

superpowers

· 阅读需 1 分钟
GoCoding

Superpowers is a complete software development methodology for your coding agents.

Superpowers 是一套完整的软件开发方法论,让你的编程智能体能够有效地协助开发。

https://github.com/obra/superpowers

MiniMind

· 阅读需 1 分钟
GoCoding

MiniMind: Train a 64M ChatBot from zero. 2 hours. ¥3. One 3090. That's it.

MiniMind: 完全从 0 开始,仅用 3 块钱成本与 2 小时训练时间,即可训练出规模约为 64M 的超小语言模型。

https://github.com/jingyaogong/minimind

SAM 3

· 阅读需 1 分钟
GoCoding

SAM 3 is a unified foundation model for promptable segmentation in images and videos.

SAM 3 是一个用于图像和视频中可提示分割的统一基础模型。

https://github.com/facebookresearch/sam3

TimesFM

· 阅读需 1 分钟
GoCoding

TimesFM (Time Series Foundation Model) is a pretrained time-series foundation model for time-series forecasting.

TimesFM(时间序列基础模型)是一个用于时间序列预测的预训练时间序列基础模型。

https://github.com/google-research/timesfm

paperclip

· 阅读需 1 分钟
GoCoding

Paperclip is an open-source orchestration for zero-human companies.

Paperclip 是一个开源的 AI 智能体业务协调平台,旨在助力“零人”公司实现自动化运营。

https://github.com/paperclipai/paperclip

nanobot

· 阅读需 1 分钟
GoCoding

nanobot: an ultra-lightweight personal AI assistant inspired by OpenClaw.

nanobot 是一个超轻量级个人 AI 助手,灵感源自 OpenClaw。

https://github.com/HKUDS/nanobot

OpenClaw

· 阅读需 1 分钟
GoCoding

OpenClaw is a personal AI assistant you run on your own devices (formerly Clawdbot)

OpenClaw 是一款运行在您个人设备上的 AI 助手(原名 Clawdbot)。

https://github.com/openclaw/openclaw