Home SkillHub Create Playground SkillKit

© 2026 TacoSkill LAB

About Privacy Terms

Home
/
SkillHub
/
llm-serving-patterns

llm-serving-patterns

1.3

177Favorites

61Upvotes

0Downvotes

LLM inference infrastructure, serving frameworks (vLLM, TGI, TensorRT-LLM), quantization techniques, batching strategies, and streaming response patterns. Use when designing LLM serving infrastructure, optimizing inference latency, or scaling LLM deployments.

serving

1.3

Rating

0

Installs

AI & LLM

Category

Quick Review

No summary available.

LLM Signals

Description coverage-

Task knowledge-

Structure-

Novelty-

GitHub Signals

49

7

1

1

Last commit 0 days ago

Publisher

majiayu000

majiayu000

Skill Author

Related Skills

mcp-developer prompt-engineer fine-tuning-expert

Loading SKILL.md…

Try onlineView on GitHub

Publisher

Skill Author

Related Skills

mcp-developer

Jeffallan

prompt-engineer

Jeffallan

fine-tuning-expert

Jeffallan

rag-architect

Jeffallan