We raised a $75m series C to build the future of inference

Return to model library

LLM

39 large language models

Llama 4 Maverick

LLM

V4.0InstructvLLMH100

Llama 4 Scout

LLM

V4.0InstructvLLMH100

Deploy Llama 3.3 Nemotron 49B Super - NVIDIA NIM on Baseten

Llama 3.3 Nemotron 49B Super - NVIDIA NIM

LLM

3.3NemotronH100

Mistral Small 3.1

LLM

3.1vLLMH100

Gemma 3 27B IT

LLM

3InstructvLLMH100

DeepSeek-R1 Llama 70B

LLM

R1LlamaTRT-LLMH100

Llama 3.3 70B Instruct

LLM

3.3TRT-LLMH100

DeepSeek-R1 Qwen 32B

LLM

R1QwenTRT-LLMH100

Qwen 2.5 14B Instruct

LLM

2.5TRT-LLMH100

Qwen 2.5 32B Coder Instruct

LLM

2.5CoderTRT-LLMH100

Qwen 2.5 7B Math Instruct

LLM

2.5MathTRT-LLMH100 MIG 40GB

Llama 3.1 8B Instruct

LLM

3.1InstructTRT-LLMH100

Qwen 2.5 32B QwQ

LLM

2.5QwQTRT-LLMH100

DeepSeek-R1

LLM

R1SGLangH200

DeepSeek-R1 Qwen 7B

LLM

R1QwenTRT-LLMH100 MIG 40GB

Llama 3.1 Nemotron 70B

LLM

3.1NemotronA100

Llama 3.1 405B Instruct

LLM

3.1InstructH100

Ultravox v0.4

LLM

0.4vLLMH100 MIG 40GB

Llama 3.2 11B Vision Instruct

LLM

3.2VisionA100

Pixtral 12B

LLM

PixtralvLLMH100

Qwen 2.5 72B Instruct

LLM

2.5TRT-LLMH100

Qwen 2.5 72B Math Instruct

LLM

2.5MathTRT-LLMH100

Qwen 2.5 14B Coder Instruct

LLM

2.5CoderTRT-LLMH100

Qwen 2.5 32B Instruct

LLM

2.5TRT-LLMH100

Qwen 2.5 7B Coder Instruct

LLM

2.5CoderTRT-LLMH100 MIG 40GB

Qwen 2.5 7B Instruct

LLM

2.5TRT-LLMH100 MIG 40GB

Mistral 7B Instruct

LLM

v3TRT-LLMH100 MIG 40GB

Llama 3.1 70B Instruct

LLM

3.1InstructTRT-LLMH100

Qwen 2.5 3B Instruct

LLM

2.5TRT-LLMA10G

DeepSeek-R1 Zero

LLM

R1ZeroSGLangH200

DeepSeek-V3

LLM

V3SGLangH200

Llama 3.2 90B Vision Instruct

LLM

3.2VisionH100

Phi 3.5 Mini Instruct

LLM

3.5128kvLLMA10G

Gemma 2 9B

LLM

vLLMA100

Gemma 2 27B

LLM

vLLMA100

Phi 3 Mini 128K Instruct

LLM

3128kT4

Phi 3 Mini 4K Instruct

LLM

34kT4

Mixtral 8x7B Instruct

LLM

v1TRT-LLMH100

Mixtral 8x22B

LLM

H100

Deploy any model in just a few commands

Avoid getting tangled in complex deployment processes. Deploy best-in-class open-source models and take advantage of optimized serving for your own models.

Start deploying

$

truss init -- example stable-diffusion-2-1-base ./my-sd-truss

$

cd ./my-sd-truss

$

export BASETEN_API_KEY=MdNmOCXc.YBtEZD0WFOYKso2A6NEQkRqTe

$

truss push

INFO

Serializing Stable Diffusion 2.1 truss.

INFO

Making contact with Baseten 👋 👽

INFO

🚀 Uploading model to Baseten 🚀

Upload progress: 0% | | 0.00G/2.39G