Keyword: vision

@sanity/vision
Released
8m ago
Version
6.2.0
Sanity plugin for running/debugging GROQ-queries against Sanity datasets
admin cms content gui headless realtime +3
@oh-my-pi/snapcompact
Released
7h ago
Version
16.2.5
Bitmap-frame context compression for vision-capable LLMs
context-compression vision compaction llm
phewsh
Released
5d ago
Version
0.15.66
Turn intent into action. Structure your thinking, execute your next step.
intent ai artifacts planning execution vision +5
@prometheus-ai/snapcompact
Released
6d ago
Version
0.5.18
Bitmap-frame context compression for vision-capable LLMs
context-compression vision compaction llm
acptoapi
Released
16h ago
Version
1.0.125
Anthropic SDK to multi-provider streaming bridge - converts Anthropic message format and tool calls to Gemini, OpenAI-compatible APIs
anthropic gemini google ai streaming proxy +8
@sogni-ai/sogni-client
Released
yesterday
Version
5.0.0
Sogni SDK - AI image, video & audio generation plus LLM chat with vision via the Sogni Supernet (Stable Diffusion, Flux, WAN 2.2, LTX-2, Seedance, Qwen VLM)
ai image-generation video-generation stable-diffusion flux wan +14
opencode-multimodal
Released
4d ago
Version
0.1.6
Give every opencode model multimodal capabilities by routing attachments to a fallback multimodal model. Configure everything via the /multimodal command.
opencode opencode-plugin multimodal vision pdf audio +1
@pk-nerdsaver-ai/snapcompact
Released
2d ago
Version
16.1.11
Bitmap-frame context compression for vision-capable LLMs
context-compression vision compaction llm
dta-vision-ocr
Released
2d ago
Version
21.2.0
Biblioteca Angular com PO UI para extração de dados estruturados via OCR a partir de imagens ou PDFs, retornando JSON configurável com suporte a processamento em lote.
ocr vision imagem pdf json angular +5
vision-electronic-indexing-pi
Released
3d ago
Version
0.1.19
Pi package for agent-assisted electronics/PCB image inventory with Cloudflare Workers AI vision and datasheet enrichment.
pi-package pi electronics pcb inventory bom +2
fmode-vision
Released
2d ago
Version
0.1.1
Claude Code skill: analyze images and videos via Fmode API vision models (api.fmode.cn). Single-pass and multi-pass focused analysis with structured JSON output. Auto-reads token from FMODE_API_TOKEN, ~/.fmode/config.json, project .fmode/config.json, or A
claude-code claude-skill fmode vision image-analysis doubao
@ljh-sh/macvision
Released
5d ago
Version
0.1.4
Turn any image into agent-friendly JSON — local macOS OCR & image understanding via Apple's Vision framework. No model, no uploads, no per-call cost.
macos cli vision ocr image-classification object-detection +2
@yorha2b-lab/autodev
Released
5d ago
Version
3.5.1
基于视觉大模型的前端(react+Antd)全自动 CRUD 代码生成器
crud generator ai vision react vue +7
@medicine-wheel/relational-index
Released
3d ago
Version
0.4.11
Four-source epistemic dimensional indexing for the Medicine Wheel Developer Suite — Land, Dream, Code, Vision traversal with cross-dimensional mapping and spiral depth metrics
medicine-wheel relational-index epistemic four-directions indigenous-research wilson +5
pi-vision-tool
Released
6d ago
Version
1.3.7
Pi Agent extension that adds a describe_image tool, letting non-multimodal models delegate image analysis to a vision-capable model (like Qwen VL)
pi-package pi-extension vision multimodal image-analysis
@joezm/seed-viz
Released
yesterday
Version
0.3.0
Vision analysis CLI + MCP server backed by Seed 2.0 via Volcano Ark or any OpenAI-compatible endpoint
seed seed-2 vision multimodal cli mcp +3
replicate-mcp-server
Released
2 weeks ago
Version
3.2.2
Universal MCP server giving any MCP client (Claude Desktop, claude.ai, Cursor, Cline, custom apps) native access to Replicate's full catalog: image, video, audio, music, speech, LLM, vision, upscale, inpaint, segment, transcription, embeddings, voice clon
mcp model-context-protocol replicate claude claude-desktop anthropic +12
sats4ai-mcp
Released
2 months ago
Version
1.5.3
Permissionless communication supercharger MCP server — 40+ Lightning-paid tools: AI phone calls in any language, voice in 602 languages, translation across 119, fax, SMS, transcription, audiobooks, and more. No signup, no API keys, no KYC.
mcp model-context-protocol ai bitcoin lightning lightning-network +14
@kyselicaa/react-native-fast-tflite
Released
19h ago
Version
2.0.10
High-performance TensorFlow Lite library for React Native
react-native tensorflow vision-camera tflite lite tensorflowlite +7
@lutery/vision-cli
Released
yesterday
Version
1.1.0
Vision CLI - Command-line interface for vision analysis with profile-based configuration
vision cli image-analysis llm glm coding-plan +1
@ghoulm370/pi-zai-vision
Released
1h ago
Version
0.1.2
Pi extension: Z.AI GLM-4.6V vision tools — image analysis, OCR, error diagnosis, diagram reading, UI diff, UI-to-code, video analysis
pi-package vision glm-4v zhipu zai mcp-vision
n8n-nodes-siliconflow-ai
Released
1h ago
Version
0.6.0
n8n community node for SiliconFlow (硅基流动). Zero runtime dependencies. Provides a SiliconFlow action node (Chat / Vision / Embeddings / Image / Rerank / Audio TTS+ASR / Video) and a LangChain-compatible Chat Model node for AI Agents. Installs cleanly witho
n8n n8n-community-node-package siliconflow silicon-flow 硅基流动 ai +14
@vikasagarwal101/zai-cli
Released
1h ago
Version
1.2.1
CLI for Z.AI capabilities: vision analysis, web search, web reader, and GitHub repo exploration. Patched fork with socket-leak, timeout, retry, and count fixes.
zai z.ai vision ocr web-search web-reader +4
n8n-nodes-zihin
Released
14h ago
Version
0.7.0
n8n nodes for Zihin AI - Chat Model with Tool Calling, Image Analysis, Audio Transcription, Document Parsing
n8n-community-node-package n8n llm ai zihin openai +14
one-shot-ui
Released
15h ago
Version
0.11.0
Deterministic UI extraction, screenshot diffing, and design-language/style transfer for AI coding agents
ui screenshot extract diff design-to-code design-tokens +8