# Private LLM Chat de IA privado e sem censura para iPhone, iPad e Mac

Sem nuvem, sem rastreamento, sem logins.

[![Download on the App Store](/app-store/download-badge/pt-BR/download.svg)](/download)[

Discord0 usuário online



](/discord)

[4.4·1.604 avaliações na App Store](/reviews)

## Execute IA offline no seu iPhone, iPad e Mac

O Private LLM roda inteiramente no seu iPhone, iPad ou Mac. Suas conversas nunca saem do dispositivo e não é necessária internet após o download inicial do modelo. Sem conta, sem rastreamento, sem logs. Uma compra desbloqueia o app em todos os seus dispositivos Apple e no seu grupo de Compartilhamento Familiar.

![Uma visão em close da tela de um iPhone exibindo a interface do app Private LLM, onde um prompt de texto é inserido em uma interface de chat, destacando a capacidade do app de executar modelos de linguagem sofisticados localmente no dispositivo para maior privacidade e funcionalidade offline](/_astro/ios_prompt.q9DZ5858.webp)

## Execute DeepSeek R1, Llama 3.3, Qwen3 e Gemma 3 localmente

O Private LLM executa os principais modelos de código aberto diretamente nos seus dispositivos Apple — DeepSeek R1 Distill, Llama 3.3 70B, Qwen3 4B, Phi 4, Google Gemma 3 e mais. Cada conversa permanece no dispositivo e cada modelo é quantizado internamente para a melhor qualidade possível no seu hardware.

[Encontre os melhores LLMs de código aberto para o seu dispositivo](/pt-BR#models)

![Captura de tela do app Private LLM em um iPhone, exibindo uma interface amigável com uma lista de Large Language Models (LLMs) disponíveis para download para uso offline, mostrando uma variedade de nomes e descrições de modelos, enfatizando a capacidade do app para experiências de IA personalizadas enquanto destaca sua privacidade e funcionalidade offline.](/_astro/downloadable_models_ios.BmHBJGeb.webp)

## IA local no Siri e Apple Shortcuts — Sem código

O Private LLM se conecta diretamente ao Siri e ao app Shortcuts. Crie fluxos de trabalho baseados em IA para resumir textos, gerar textos ou enviar respostas para qualquer um dos mais de 70 apps que suportam a especificação [x-callback-url](https://x-callback-url.com/). Nenhum código é necessário.

[Veja Apple Shortcuts criados por usuários para o Private LLM](/pt-BR/community-shortcuts)

![Um iPhone exibindo a interface do app Private LLM com uma integração de Apple Shortcut, mostrando uma experiência de usuário fluida para personalizar interações de IA no iOS](/_astro/shortcuts.CRkFn8Aq.webp)

## Uma compra, sem assinatura — Compartilhamento Familiar para seis

Abandone as assinaturas por uma escolha mais inteligente com o Private LLM. Uma única compra desbloqueia o app em todas as plataformas Apple — iPhone, iPad e Mac — permitindo o Compartilhamento Familiar para até seis parentes. Essa abordagem simplifica o acesso e amplia o valor do seu investimento, tornando a privacidade e a inteligência digital universalmente disponíveis para sua família.

![Captura de tela da interface do Private LLM no macOS, apresentando um usuário digitando um prompt no campo de entrada de texto do aplicativo, pronto para receber respostas instantâneas e offline do modelo de linguagem local](/_astro/macos_prompt.DfGFHq6k.webp)

## Ferramentas de escrita com IA integradas ao macOS

Selecione qualquer texto em qualquer app do macOS, clique com o botão direito e o Private LLM reescreve, resume ou corrige — inteiramente no dispositivo. Suporta inglês e os principais idiomas da Europa Ocidental.

![Captura de tela mostrando a integração do Private LLM no menu de serviços do sistema macOS.](/_astro/macos-service-menu.B1QmQmpp.webp)

## Criado por dois engenheiros, não por VCs

O Private LLM foi criado por dois engenheiros na UE — financiado por conta própria, sem capital de risco, sem roteiro de crescimento forçado. Somos o único app na App Store com quantização OmniQuant e GPTQ, que produzem resultados comprovadamente melhores do que a quantização RTN usada por apps baseados em MLX e llama.cpp, como Ollama e LM Studio. Respondemos aos usuários, não a investidores — é por isso que seus dados permanecem no dispositivo e sempre permanecerão.

![Um iPhone exibindo a interface do app Private LLM com uma integração de Apple Shortcut, mostrando uma experiência de usuário fluida para personalizar interações de IA no iOS](/_astro/independent-devs.nPY4P8E5.png)

Da App Store

## Avaliações reais de usuários de iPhone e Mac

> “This is a private AI app created by developers performing constant updates and not charging a subscription. That is rare nowadays! Bravo, looking forward to the updates as this continues to improve!”

🇺🇸8parental8 · Avaliação da App Store

Avaliação 1 de 5

[Leia as avaliações da App Store](/reviews)

## Quantização OmniQuant e GPTQ: Melhor resultado, menos memória

O Private LLM usa [OmniQuant](https://arxiv.org/abs/2308.13137) e quantização GPTQ. Quando LLMs são quantizados para inferência no dispositivo, valores de peso discrepantes prejudicam a qualidade da geração de texto. O OmniQuant modula pesos discrepantes com um mecanismo de corte baseado em otimização que minimiza o erro de quantização. O GPTQ usa informações de segunda ordem (Hessiana) aproximadas para minimizar o erro de reconstrução nos pesos mais importantes. A quantização RTN afim usada por apps baseados em MLX, como o LM Studio, e as variantes RTN em blocos usadas por apps baseados em llama.cpp, como o Ollama, ignoram esse tipo de otimização por peso — é por isso que esses apps produzem resultados de menor qualidade no mesmo hardware Apple. Exploramos constantemente métodos avançados de quantização, um trabalho que apps baseados em motores de inferência de terceiros não podem realizar. OmniQuant e GPTQ, combinados com kernels Metal otimizados para modelos específicos, permitem que o Private LLM entregue uma geração de texto rápida e de alta qualidade no hardware Apple.

[Private LLM vs Ollama](/compare/ollama-vs-private-llm)

## Baixe os melhores LLMs de código aberto

iOS

### Modelos baseados em Qwen3 4B

Para iPhones/iPads com 6GB+ de RAM

[Qwen3 4B Instruct 2507](https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507)[Qwen3 4B Instruct 2507 Abliterated (Uncensored)](https://huggingface.co/huihui-ai/Huihui-Qwen3-4B-Instruct-2507-abliterated)[Josiefied Qwen3 4B Instruct 2507 (Uncensored)](https://huggingface.co/Goekdeniz-Guelmez/Josiefied-Qwen3-4B-Instruct-2507-gabliterated-v1)[Qwen3 4B Instruct 2507 Heretic (Uncensored)](https://huggingface.co/p-e-w/Qwen3-4B-Instruct-2507-heretic)[Qwen3 4B Instruct 2507 Heretic NoSlop (Uncensored)](https://huggingface.co/numen-tech/Qwen3-4B-Instruct-2507-heretic-noslop-GPTQ-Int4)

### Modelos baseados em DeepSeek R1 Distill

Para iPhones/iPads com 8GB+ de RAM

[DeepSeek R1 Distill Llama 8B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-8B)[DeepSeek R1 Distill Qwen 7B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B)[DeepSeek R1 Distill Llama 8B Abliterated (Uncensored)](https://huggingface.co/huihui-ai/DeepSeek-R1-Distill-Llama-8B-abliterated)

### Modelos baseados em DeepSeek R1 Distill

Para iPhones/iPads com 16GB+ de RAM

[DeepSeek R1 Distill Qwen 14B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B)

### Modelos baseados em Meta Llama 3.2 3B

Para iPhones/iPads com 6GB+ de RAM

[Meta Llama 3.2 3B Instruct 🦙](https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct)[Llama 3.2 3B Instruct Abliterated 🦙 (Uncensored)](https://huggingface.co/huihui-ai/Llama-3.2-3B-Instruct-abliterated)[Llama 3.2 3B Instruct Uncensored 🦙](https://huggingface.co/chuanli11/Llama-3.2-3B-Instruct-uncensored)[Hermes 3 Llama 3.2 3B](https://huggingface.co/NousResearch/Hermes-3-Llama-3.2-3B)[FuseChat Llama 3.2 3B Instruct](https://huggingface.co/FuseAI/FuseChat-Llama-3.2-3B-Instruct)[Dolphin 3.0 Llama 3.2 3B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.2-3B)

### Modelos baseados em Meta Llama 3.2 1B

Para iPhones/iPads com 4GB+ de RAM

[Meta Llama 3.2 1B Instruct 🦙](https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct)[Llama 3.2 1B Instruct Abliterated 🦙 (Uncensored)](https://huggingface.co/huihui-ai/Llama-3.2-1B-Instruct-abliterated)[FuseChat Llama 3.2 1B Instruct](https://huggingface.co/FuseAI/FuseChat-Llama-3.2-1B-Instruct)[Dolphin 3.0 Llama 3.2 1B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.2-1B)

### Modelos baseados em Google Gemma 3 1B

Para iPhones/iPads com 4GB+ de RAM

[Gemma 3 1B IT 💎](https://huggingface.co/google/gemma-3-1b-it)[Gemma 3 1B IT Abliterated (Uncensored)](https://huggingface.co/mlabonne/gemma-3-1b-it-abliterated)[Amoral Gemma 3 1B v2 (Uncensored)](https://huggingface.co/soob3123/amoral-gemma3-1B-v2)

### Modelos baseados em Google Gemma 2 9B

Para iPhones/iPads com 16GB+ de RAM

[Gemma-2 9B IT 💎](https://huggingface.co/google/gemma-2-9b-it)[Gemma-2 9B IT SPPO Iter3](https://huggingface.co/UCLA-AGI/Gemma-2-9B-It-SPPO-Iter3)[Tiger Gemma 9B v3 🐅 (Uncensored)](https://huggingface.co/TheDrummer/Tiger-Gemma-9B-v3)[FuseChat Gemma 2 9B Instruct](https://huggingface.co/FuseAI/FuseChat-Gemma-2-9B-Instruct)[Gemma 2 Ifable 9B (Creative Writing)](https://huggingface.co/ifable/gemma-2-Ifable-9B)

### Modelos baseados em Google Gemma 2 2B

Para iPhones/iPads com 4GB+ de RAM

[Gemma-2 2B IT 💎](https://huggingface.co/google/gemma-2-2b-it)[SauerkrautLM Gemma-2 2B IT](https://huggingface.co/VAGOsolutions/SauerkrautLM-gemma-2-2b-it)

### Modelos baseados em Meta Llama 3.1 8B

Para iPhones/iPads com 8GB+ de RAM

[Meta Llama 3.1 8B Instruct 🦙](https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct)[Meta Llama 3.1 8B Instruct Abliterated 🦙(Uncensored)](https://huggingface.co/mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated)[Hermes 3 Llama 3.1 8B](https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B)[FuseChat Llama 3.1 8B Instruct](https://huggingface.co/FuseAI/FuseChat-Llama-3.1-8B-Instruct)[Llama 3.1 8B Lexi Uncensored V2 (Therapy/Role-Play)](https://huggingface.co/Orenguteng/Llama-3.1-8B-Lexi-Uncensored-V2)[Dolphin 3.0 Llama 3.1 8B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.1-8B)[Meta Llama 3.1 8B Survive V3 (Survival Specialist)](https://huggingface.co/lolzinventor/Meta-Llama-3.1-8B-SurviveV3)[Llama 3.1 8B UltraMedical 🏥 (Biomedical)](https://huggingface.co/TsinghuaC3I/Llama-3.1-8B-UltraMedical)

### Modelos baseados em Meta Llama 3 8B

Para iPhones/iPads com 6GB+ de RAM

[Meta Llama 3 8B Instruct 🦙](https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct)[Meta Llama 3 8B Instruct Abliterated v3 (Uncensored)](https://huggingface.co/failspy/Meta-Llama-3-8B-Instruct-abliterated-v3)[NeuralDaredevil 8B Abliterated (Uncensored)](https://huggingface.co/mlabonne/NeuralDaredevil-8B-abliterated)[Llama 3 8B Instruct MopeyMule](https://huggingface.co/failspy/Llama-3-8B-Instruct-MopeyMule)[Llama 3 WhiteRabbitNeo 8B v2.0](https://huggingface.co/WhiteRabbitNeo/Llama-3-WhiteRabbitNeo-8B-v2.0)[Hermes 2 Theta Llama 3 8B](https://huggingface.co/NousResearch/Hermes-2-Theta-Llama-3-8B)[LLaMA3-iterative-DPO-final](https://huggingface.co/RLHFlow/LLaMA3-iterative-DPO-final)[Hathor\_Stable-v0.2-L3-8B](https://huggingface.co/Nitral-AI/Hathor_Stable-v0.2-L3-8B)[Openchat 3.6 8B 20240522](https://huggingface.co/openchat/openchat-3.6-8b-20240522)[Dolphin 2.9 Llama 3 8B (Uncensored) 🐬](https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b)[Llama 3 Smaug 8B](https://huggingface.co/abacusai/Llama-3-Smaug-8B)[Hermes 2 Pro Llama 3 8B ☤](https://huggingface.co/NousResearch/Hermes-2-Pro-Llama-3-8B)[OpenBioLLM-8B 🧬 (Biomedical)](https://huggingface.co/aaditya/Llama3-OpenBioLLM-8B)[L3 Umbral Mind RP v3.0 8B 🌓](https://huggingface.co/Casual-Autopsy/L3-Umbral-Mind-RP-v3.0-8B)[Llama 3 Instruct 8B SPPO Iter3](https://huggingface.co/UCLA-AGI/Llama-3-Instruct-8B-SPPO-Iter3)

### Modelos baseados em Qwen 2.5

Para iPhones/iPads com 4GB+ de RAM

[Qwen 2.5 0.5B Unquantized](https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct)[Qwen 2.5 Coder 0.5B Unquantized](https://huggingface.co/Qwen/Qwen2.5-Coder-0.5B-Instruct)[Dolphin 3.0 Qwen 2.5 0.5B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Qwen2.5-0.5B)[Qwen 2.5 1.5B](https://huggingface.co/Qwen/Qwen2.5-1.5B-Instruct)[Qwen 2.5 Coder 1.5B](https://huggingface.co/Qwen/Qwen2.5-Coder-1.5B-Instruct)[EVA-D Qwen2.5 1.5B v0.0 (Role-Play/Story Writing)](https://huggingface.co/EVA-UNIT-01/EVA-D-Qwen2.5-1.5B-v0.0)[Dolphin 3.0 Qwen 2.5 1.5B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Qwen2.5-1.5B)[Qwen 2.5 3B](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)[Qwen 2.5 Coder 3B](https://huggingface.co/Qwen/Qwen2.5-Coder-3B-Instruct)[Dolphin 3.0 Qwen 2.5 3B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Qwen2.5-3b)

### Modelos baseados em Qwen 2.5

Para iPhones/iPads com 8GB+ de RAM

[Qwen 2.5 7B](https://huggingface.co/Qwen/Qwen2.5-7B-Instruct)[FuseChat Qwen 2.5 7B Instruct](https://huggingface.co/FuseAI/FuseChat-Qwen-2.5-7B-Instruct)[EVA Qwen2.5 7B v0.1 (Role-Play/Story Writing)](https://huggingface.co/EVA-UNIT-01/EVA-Qwen2.5-7B-v0.1)[OpenHands LM 7B v0.1 (Coding)](https://huggingface.co/all-hands/openhands-lm-7b-v0.1)

### Modelos baseados em Qwen 2.5

Para iPhones/iPads com 8GB+ de RAM

[Qwen 2.5 Coder 7B](https://huggingface.co/Qwen/Qwen2.5-Coder-7B-Instruct)

### Modelos baseados em Qwen 2.5 14B

Para iPhones/iPads com 16GB+ de RAM

[Qwen 2.5 Coder 14B](https://huggingface.co/Qwen/Qwen2.5-Coder-14B-Instruct)[EVA Qwen2.5 14B v0.2 (Role-Play/Story Writing)](https://huggingface.co/EVA-UNIT-01/EVA-Qwen2.5-14B-v0.2)

### Modelos baseados em Phi-3 Mini 3.8B

Para iPhones/iPads com 6GB+ de RAM

[Phi-3 Mini 4K Instruct](https://huggingface.co/microsoft/Phi-3-mini-4k-instruct)[Kappa-3 Phi Abliterated (Uncensored)](https://huggingface.co/failspy/kappa-3-phi-abliterated)

### Modelos baseados em Google Gemma

Para iPhones/iPads com 8GB+ de RAM

[Gemma 2B IT 💎](https://huggingface.co/google/gemma-2b-it/)[Gemma 1.1 2B IT 💎](https://huggingface.co/google/gemma-1.1-2b-it)

### Modelos baseados em Mistral 7B

Para iPhones/iPads com 6GB+ de RAM

[Mistral 7B Instruct v0.3](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.3)[Mistral 7B Instruct v0.2](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.2)[OpenHermes 2.5 Mistral 7B ☤](https://huggingface.co/teknium/OpenHermes-2.5-Mistral-7B)[Hermes 2 Pro Mistral 7B ☤](https://huggingface.co/NousResearch/Hermes-2-Pro-Mistral-7B)[RakutenAI 7B Chat 🇯🇵](https://huggingface.co/Rakuten/RakutenAI-7B-chat)[openchat-3.5-0106 7B 💬](https://huggingface.co/openchat/openchat-3.5-0106)[CodeNinja 1.0 OpenChat 7B 🥷](https://huggingface.co/beowolx/CodeNinja-1.0-OpenChat-7B)[Starling LM 7B Beta 🐤](https://huggingface.co/Nexusflow/Starling-LM-7B-beta)[Dolphin 2.8 Mistral 7B v0.2 (Uncensored) 🐬](https://huggingface.co/cognitivecomputations/dolphin-2.8-mistral-7b-v02)[DictaLM 2.0 Instruct 🇮🇱](https://huggingface.co/dicta-il/dictalm2.0-instruct)

### Modelos baseados em Llama 2 7B

Para iPhones/iPads com 6GB+ de RAM

[Airoboros l2 7b 3.0](https://huggingface.co/jondurbin/airoboros-l2-7b-3.0)[Spicyboros 7b 2.2 🌶️](https://huggingface.co/jondurbin/spicyboros-7b-2.2)

### Modelos baseados em Phi-2 3B

Para iPhones/iPads com 4GB+ de RAM

[Phi-2 Orange 🍊](https://huggingface.co/rhysjones/phi-2-orange)[Dolphin 2.6 Phi-2 (Uncensored) 🐬](https://huggingface.co/cognitivecomputations/dolphin-2_6-phi-2)[Phi-2 Super 🤖](https://huggingface.co/abacaj/phi-2-super)[Phi-2 Orange v2 🍊](https://huggingface.co/rhysjones/phi-2-orange-v2)

### Modelos baseados em H2O Danube

Para iPhones/iPads com 4GB+ de RAM

[H2O Danube 1.8B Chat](https://huggingface.co/h2oai/h2o-danube-1.8b-chat)

### Modelos baseados em StableLM 3B

Para iPhones/iPads com 4GB+ de RAM

[StableLM 2 Zephyr 1.6B 🪁](https://huggingface.co/stabilityai/stablelm-2-zephyr-1_6b)[Nous-Capybara-3B V1.9](https://huggingface.co/NousResearch/Nous-Capybara-3B-V1.9)[Rocket 3B 🚀](https://huggingface.co/pansophic/rocket-3B)

### Modelos baseados em TinyLlama 1.1B

Para iPhones/iPads com 4GB+ de RAM

[TinyLlama 1.1B Chat 🦙](https://huggingface.co/TinyLlama/TinyLlama-1.1B-Chat-v1.0)[TinyDolphin 2.8 1.1B Chat 🐬](https://huggingface.co/cognitivecomputations/TinyDolphin-2.8-1.1b)

### Modelos baseados em Yi 6B

Para iPhones/iPads com 6GB+ de RAM

[Yi 6B Chat 🇨🇳](https://huggingface.co/01-ai/Yi-6B-Chat)

macOS

### Modelos baseados em DeepSeek R1 Distill

Para Macs com Apple Silicon com 16GB+ de RAM

[DeepSeek R1 Distill Llama 8B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-8B)[DeepSeek R1 Distill Llama 8B Abliterated (Uncensored)](https://huggingface.co/huihui-ai/DeepSeek-R1-Distill-Llama-8B-abliterated)[DeepSeek R1 Distill Qwen 7B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-7B)[DeepSeek R1 Distill Qwen 14B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Qwen-14B)

### Modelos baseados em DeepSeek R1 Distill

Para Macs com Apple Silicon com 32GB+ de RAM

[Fuse O1 DeepSeek R1 QwQ SkyT1 32B](https://huggingface.co/FuseAI/FuseO1-DeepSeekR1-QwQ-SkyT1-32B-Preview)[DeepSeek R1 Distill Qwen 32B Abliterated (Uncensored)](https://huggingface.co/huihui-ai/DeepSeek-R1-Distill-Qwen-32B-abliterated)

### Modelos baseados em DeepSeek R1 Distill

Para Macs com Apple Silicon com 48GB+ de RAM

[DeepSeek R1 Distill Llama 70B](https://huggingface.co/deepseek-ai/DeepSeek-R1-Distill-Llama-70B)[R1 1776 Distill Llama 70B](https://huggingface.co/perplexity-ai/r1-1776-distill-llama-70b)

### Modelos baseados em Google Gemma 3 1B

Para Macs com Apple Silicon com 8GB+ de RAM

[Gemma 3 1B IT 💎](https://huggingface.co/google/gemma-3-1b-it)[Gemma 3 1B IT Abliterated (Uncensored)](https://huggingface.co/mlabonne/gemma-3-1b-it-abliterated)[Amoral Gemma 3 1B v2 (Uncensored)](https://huggingface.co/soob3123/amoral-gemma3-1B-v2)

### Modelos baseados em Phi-4 14B

Para Macs com Apple Silicon com 16GB+ de RAM

[Phi-4](https://huggingface.co/microsoft/phi-4)

### Modelos baseados em Meta Llama 3.3 70B

Para Macs com Apple Silicon com 48GB+ de RAM

[Meta Llama 3.3 70B Instruct 🦙](https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct)[Llama 3.3 70B Instruct Abliterated (Uncensored)](https://huggingface.co/huihui-ai/Llama-3.3-70B-Instruct-abliterated)[EVA LLaMA 3.33 70B v0.1 (Role-Play/Story Writing)](https://huggingface.co/EVA-UNIT-01/EVA-LLaMA-3.33-70B-v0.1)[Llama 3.3 70B Euryale v2.3 (Role-Play/Story Writing)](https://huggingface.co/Sao10K/L3.3-70B-Euryale-v2.3)

### Modelos baseados em Meta Llama 3.2 3B

Para Macs com Apple Silicon com 8GB+ de RAM

[Meta Llama 3.2 3B Instruct 🦙](https://huggingface.co/meta-llama/Llama-3.2-3B-Instruct)[Dolphin 3.0 Llama 3.2 3B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.2-3B)[Llama 3.2 3B Instruct Abliterated 🦙 (Uncensored)](https://huggingface.co/huihui-ai/Llama-3.2-3B-Instruct-abliterated)[Llama 3.2 3B Instruct Uncensored 🦙](https://huggingface.co/chuanli11/Llama-3.2-3B-Instruct-uncensored)[Hermes 3 Llama 3.2 3B](https://huggingface.co/NousResearch/Hermes-3-Llama-3.2-3B)[FuseChat Llama 3.2 3B Instruct](https://huggingface.co/FuseAI/FuseChat-Llama-3.2-3B-Instruct)

### Modelos baseados em Meta Llama 3.2 1B

Para Macs com Apple Silicon com 8GB+ de RAM

[Meta Llama 3.2 1B Instruct 🦙](https://huggingface.co/meta-llama/Llama-3.2-1B-Instruct)[Dolphin 3.0 Llama 3.2 1B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.2-1B)[Llama 3.2 1B Instruct Abliterated 🦙 (Uncensored)](https://huggingface.co/huihui-ai/Llama-3.2-1B-Instruct-abliterated)[FuseChat Llama 3.2 1B Instruct](https://huggingface.co/FuseAI/FuseChat-Llama-3.2-1B-Instruct)

### Modelos baseados em Meta Llama 3.1 70B

Para Macs com Apple Silicon com 64GB+ de RAM

[Meta Llama 3.1 70B Instruct 🦙](https://huggingface.co/meta-llama/Meta-Llama-3.1-70B-Instruct)

### Modelos baseados em Meta Llama 3.1 8B

Para Macs com Apple Silicon com 8GB+ de RAM

[Meta Llama 3.1 8B Instruct 🦙](https://huggingface.co/meta-llama/Meta-Llama-3.1-8B-Instruct)[Meta Llama 3.1 8B Instruct Abliterated 🦙(Uncensored)](https://huggingface.co/mlabonne/Meta-Llama-3.1-8B-Instruct-abliterated)[Hermes 3 Llama 3.1 8B](https://huggingface.co/NousResearch/Hermes-3-Llama-3.1-8B)[FuseChat Llama 3.1 8B Instruct](https://huggingface.co/FuseAI/FuseChat-Llama-3.1-8B-Instruct)[Llama 3.1 8B Lexi Uncensored V2 (Therapy/Role-Play)](https://huggingface.co/Orenguteng/Llama-3.1-8B-Lexi-Uncensored-V2)[Dolphin 3.0 Llama 3.1 8B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Llama3.1-8B)[Meta Llama 3.1 8B Survive V3 (Survival Specialist)](https://huggingface.co/lolzinventor/Meta-Llama-3.1-8B-SurviveV3)[Llama 3.1 8B UltraMedical 🏥 (Biomedical)](https://huggingface.co/TsinghuaC3I/Llama-3.1-8B-UltraMedical)

### Modelos baseados em Qwen 2.5

Para Macs com Apple Silicon com 8GB+ de RAM

[Qwen 2.5 0.5B Unquantized](https://huggingface.co/Qwen/Qwen2.5-0.5B-Instruct)[Qwen 2.5 1.5B](https://huggingface.co/Qwen/Qwen2.5-1.5B-Instruct)[Qwen 2.5 3B](https://huggingface.co/Qwen/Qwen2.5-3B-Instruct)[Qwen 2.5 7B](https://huggingface.co/Qwen/Qwen2.5-7B-Instruct)[Qwen 2.5 Coder 0.5B Unquantized](https://huggingface.co/Qwen/Qwen2.5-Coder-0.5B-Instruct)[Qwen 2.5 Coder 1.5B](https://huggingface.co/Qwen/Qwen2.5-Coder-1.5B-Instruct)[Qwen 2.5 Coder 3B](https://huggingface.co/Qwen/Qwen2.5-Coder-3B-Instruct)[Qwen 2.5 Coder 7B](https://huggingface.co/Qwen/Qwen2.5-Coder-7B-Instruct)[FuseChat Qwen 2.5 7B Instruct](https://huggingface.co/FuseAI/FuseChat-Qwen-2.5-7B-Instruct)[EVA-D Qwen2.5 1.5B v0.0 (Role-Play/Story Writing)](https://huggingface.co/EVA-UNIT-01/EVA-D-Qwen2.5-1.5B-v0.0)[EVA Qwen2.5 7B v0.1 (Role-Play/Story Writing)](https://huggingface.co/EVA-UNIT-01/EVA-Qwen2.5-7B-v0.1)[Dolphin 3.0 Qwen 2.5 0.5B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Qwen2.5-0.5B)[Dolphin 3.0 Qwen 2.5 1.5B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Qwen2.5-1.5B)[Dolphin 3.0 Qwen 2.5 3B 🐬 (Uncensored)](https://huggingface.co/cognitivecomputations/Dolphin3.0-Qwen2.5-3b)

### Modelos baseados em Qwen 2.5 14B

Para Macs com Apple Silicon com 16GB+ de RAM

[Qwen 2.5 Coder 14B](https://huggingface.co/Qwen/Qwen2.5-Coder-14B-Instruct)[EVA Qwen2.5 14B v0.2 (Role-Play/Story Writing)](https://huggingface.co/EVA-UNIT-01/EVA-Qwen2.5-14B-v0.2)

### Modelos baseados em Qwen3 4B

Para Macs com Apple Silicon com 16GB+ de RAM

[Qwen3 4B Instruct 2507](https://huggingface.co/Qwen/Qwen3-4B-Instruct-2507)[Qwen3 4B Instruct 2507 Abliterated (Uncensored)](https://huggingface.co/huihui-ai/Huihui-Qwen3-4B-Instruct-2507-abliterated)[Josiefied Qwen3 4B Instruct 2507 (Uncensored)](https://huggingface.co/Goekdeniz-Guelmez/Josiefied-Qwen3-4B-Instruct-2507-gabliterated-v1)[Qwen3 4B Instruct 2507 Heretic (Uncensored)](https://huggingface.co/p-e-w/Qwen3-4B-Instruct-2507-heretic)[Qwen3 4B Instruct 2507 Heretic NoSlop (Uncensored)](https://huggingface.co/numen-tech/Qwen3-4B-Instruct-2507-heretic-noslop-GPTQ-Int4)

### Modelos baseados em Qwen 2.5 32B

Para Macs com Apple Silicon com 24GB+ de RAM

[Qwen 2.5 32B](https://huggingface.co/Qwen/Qwen2.5-32B-Instruct)[Qwen 2.5 Coder 32B](https://huggingface.co/Qwen/Qwen2.5-Coder-32B-Instruct)[EVA Qwen2.5 32B v0.2 (Role-Play/Story Writing)](https://huggingface.co/EVA-UNIT-01/EVA-Qwen2.5-32B-v0.2)[OpenHands LM 32B v0.1 (Coding)](https://huggingface.co/all-hands/openhands-lm-32b-v0.1)

### Modelos baseados em Google Gemma 2 9B

Para Macs com Apple Silicon com 16GB+ de RAM

[Gemma-2 9B IT 💎](https://huggingface.co/google/gemma-2-9b-it)[Gemma-2 9B IT SPPO Iter3](https://huggingface.co/UCLA-AGI/Gemma-2-9B-It-SPPO-Iter3)[Tiger Gemma 9B v3 🐅 (Uncensored)](https://huggingface.co/TheDrummer/Tiger-Gemma-9B-v3)[FuseChat Gemma 2 9B Instruct](https://huggingface.co/FuseAI/FuseChat-Gemma-2-9B-Instruct)[Gemma 2 Ifable 9B (Creative Writing)](https://huggingface.co/ifable/gemma-2-Ifable-9B)

### Modelos baseados em Google Gemma 2 2B

Para Macs com Apple Silicon com 8GB+ de RAM

[Gemma-2 2B IT 💎](https://huggingface.co/google/gemma-2-2b-it)[SauerkrautLM Gemma-2 2B IT](https://huggingface.co/VAGOsolutions/SauerkrautLM-gemma-2-2b-it)

### Modelos baseados em Meta Llama 3 70B

Para Macs com Apple Silicon com 48GB+ de RAM

[Meta Llama 3 70B Instruct 🦙](https://huggingface.co/meta-llama/Meta-Llama-3-70B)[Smaug Llama 3 70B Instruct](https://huggingface.co/abacusai/Smaug-Llama-3-70B-Instruct)[Smaug Llama 3 70B Instruct Abliterated v3 (Uncensored)](https://huggingface.co/failspy/Smaug-Llama-3-70B-Instruct-abliterated-v3)[Cat Llama 3 70B Instruct](https://huggingface.co/turboderp/Cat-Llama-3-70B-instruct)

### Modelos baseados em Meta Llama 3 8B

Para Macs com Apple Silicon com 8GB+ de RAM

[Meta Llama 3 8B Instruct 🦙](https://huggingface.co/meta-llama/Meta-Llama-3-8B-Instruct)[Meta Llama 3 8B Instruct Abliterated v3 (Uncensored)](https://huggingface.co/failspy/Meta-Llama-3-8B-Instruct-abliterated-v3)[NeuralDaredevil 8B Abliterated (Uncensored)](https://huggingface.co/mlabonne/NeuralDaredevil-8B-abliterated)[Llama 3 8B Instruct MopeyMule](https://huggingface.co/failspy/Llama-3-8B-Instruct-MopeyMule)[Llama 3 WhiteRabbitNeo 8B v2.0](https://huggingface.co/WhiteRabbitNeo/Llama-3-WhiteRabbitNeo-8B-v2.0)[Hermes 2 Theta Llama 3 8B](https://huggingface.co/NousResearch/Hermes-2-Theta-Llama-3-8B)[LLaMA3-iterative-DPO-final](https://huggingface.co/RLHFlow/LLaMA3-iterative-DPO-final)[Hathor\_Stable-v0.2-L3-8B](https://huggingface.co/Nitral-AI/Hathor_Stable-v0.2-L3-8B)[Openchat 3.6 8B 20240522](https://huggingface.co/openchat/openchat-3.6-8b-20240522)[Dolphin 2.9 Llama 3 8B (Uncensored) 🐬](https://huggingface.co/cognitivecomputations/dolphin-2.9-llama3-8b)[Llama 3 Smaug 8B](https://huggingface.co/abacusai/Llama-3-Smaug-8B)[Hermes 2 Pro Llama 3 8B ☤](https://huggingface.co/NousResearch/Hermes-2-Pro-Llama-3-8B)[OpenBioLLM-8B 🧬 (Biomedical)](https://huggingface.co/aaditya/Llama3-OpenBioLLM-8B)[L3 Umbral Mind RP v3.0 8B 🌓](https://huggingface.co/Casual-Autopsy/L3-Umbral-Mind-RP-v3.0-8B)[Llama 3 Instruct 8B SPPO Iter3](https://huggingface.co/UCLA-AGI/Llama-3-Instruct-8B-SPPO-Iter3)

### Modelos baseados em Phi-3 Mini 3.8B

Para Macs com Apple Silicon com 8GB+ de RAM

[Phi-3 Mini 4K Instruct](https://huggingface.co/microsoft/Phi-3-mini-4k-instruct)[Kappa-3 Phi Abliterated (Uncensored)](https://huggingface.co/failspy/kappa-3-phi-abliterated)

### Modelos baseados em Google Gemma

Para Macs com Apple Silicon com 8GB+ de RAM

[Gemma 2B IT 💎](https://huggingface.co/google/gemma-2b-it/)[Gemma 1.1 2B IT 💎](https://huggingface.co/google/gemma-1.1-2b-it)

### Modelos baseados em Mixtral 8x7B

Para Macs com Apple Silicon com 32GB+ de RAM

[Mixtral-8x7B-Instruct-v0.1](https://huggingface.co/mistralai/Mixtral-8x7B-Instruct-v0.1)[Dolphin 2.6 Mixtral 8x7B 🐬](https://huggingface.co/cognitivecomputations/dolphin-2.6-mixtral-8x7b)[Nous Hermes 2 Mixtral 8x7B DPO ☤](https://huggingface.co/NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO)

### Modelos baseados em Llama 33B

Para Macs com Apple Silicon com 24GB+ de RAM

[WizardLM 33B v1.0 (Uncensored)](https://huggingface.co/cognitivecomputations/WizardLM-33B-V1.0-\(Uncensored\))

### Modelos baseados em Llama 2 13B

Para Macs com Apple Silicon com 16GB+ de RAM

[Wizard LM 13B](https://huggingface.co/WizardLM/WizardLM-13B-V1.2)[Spicyboros 13B 🌶️](https://huggingface.co/jondurbin/spicyboros-13b-2.2)[Synthia 13B 1.2](https://huggingface.co/migtissera/Synthia-13B-v1.2)[XWin-LM-13B](https://huggingface.co/Xwin-LM/Xwin-LM-13B-V0.1)[Mythomax L2 13B](https://huggingface.co/Gryphe/MythoMax-L2-13b)

### Modelos baseados em CodeLlama 13B

Para Macs com Apple Silicon com 16GB+ de RAM

[WhiteRabbitNeo-13B-v1](https://huggingface.co/WhiteRabbitNeo/WhiteRabbitNeo-13B-v1)

### Modelos baseados em Llama 2 7B

Para Macs com Apple Silicon com 8GB+ de RAM

[airoboros-l2-7b-3.0](https://huggingface.co/jondurbin/airoboros-l2-7b-3.0)[Spicyboros 7b 2.2 🌶️](https://huggingface.co/jondurbin/spicyboros-7b-2.2)[Xwin-LM-7B v0.1](https://huggingface.co/Xwin-LM/Xwin-LM-7B-V0.1)

### Modelos baseados em Solar 10.7B

Para Macs com Apple Silicon com 16GB+ de RAM

[Nous-Hermes-2-SOLAR-10.7B ☤](https://huggingface.co/NousResearch/Nous-Hermes-2-SOLAR-10.7B)

### Modelos baseados em Phi-2 3B

Para Macs com Apple Silicon com 8GB+ de RAM

[Phi-2 Orange 🍊](https://huggingface.co/rhysjones/phi-2-orange)[Phi-2 Orange Version 2 🍊](https://huggingface.co/rhysjones/phi-2-orange-v2)[Dolphin 2.6 Phi-2 (Uncensored) 🐬](https://huggingface.co/cognitivecomputations/dolphin-2_6-phi-2)

### Modelos baseados em Mistral 7B

Para Macs com Apple Silicon com 8GB+ de RAM

[Mistral 7B Instruct v0.3](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.3)[Mistral 7B Instruct v0.2](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.2)[Mistral Instruct v0.1](https://huggingface.co/mistralai/Mistral-7B-Instruct-v0.1)[Mistral-7B-OpenOrca](https://huggingface.co/Open-Orca/Mistral-7B-OpenOrca)[Zephyr 7B Beta 🪁](https://huggingface.co/HuggingFaceH4/zephyr-7b-beta)[Leo Mistral Hessian AI 7B 🇩🇪](https://huggingface.co/LeoLM/leo-mistral-hessianai-7b-chat/tree/main)[Jackalope 7B](https://huggingface.co/openaccess-ai-collective/jackalope-7b)[Dolphin 2.1 Mistral (Uncensored) 🐬](https://huggingface.co/cognitivecomputations/dolphin-2.1-mistral-7b)[Samantha 1.2 Mistral](https://huggingface.co/cognitivecomputations/samantha-1.2-mistral-7b)[OpenHermes 2 Mistral ☤](https://huggingface.co/teknium/OpenHermes-2-Mistral-7B)[SynthIA 7B 2.0](https://huggingface.co/migtissera/SynthIA-7B-v2.0)[Airoboros M 7B](https://huggingface.co/jondurbin/airoboros-m-7b-3.1.2)[Mistral Trismegistus 7B](https://huggingface.co/teknium/Mistral-Trismegistus-7B)[Cerbero 7B 🇮🇹](https://huggingface.co/galatolo/cerbero-7b)[openchat-3.5-0106 7B](https://huggingface.co/openchat/openchat-3.5-0106)[CodeNinja 1.0 OpenChat 7B 🥷](https://huggingface.co/beowolx/CodeNinja-1.0-OpenChat-7B)[BioMistral 7B 🧬 (Biomedical)](https://huggingface.co/BioMistral/BioMistral-7B)[Nous-Hermes-2-Mistral-7B-DPO ☤](https://huggingface.co/NousResearch/Nous-Hermes-2-Mistral-7B-DPO)[Merlinite 7B 🧙](https://huggingface.co/ibm/merlinite-7b)[RakutenAI 7B Chat 🇯🇵](https://huggingface.co/Rakuten/RakutenAI-7B-chat)[Starling LM 7B Beta 🐤](https://huggingface.co/Nexusflow/Starling-LM-7B-beta)[DictaLM 2.0 Instruct 🇮🇱](https://huggingface.co/dicta-il/dictalm2.0-instruct)

### Modelos baseados em StableLM 3B

Para Macs com Apple Silicon com 8GB+ de RAM

[StableLM Zephyr 3B 🪁](https://huggingface.co/stabilityai/stablelm-zephyr-3b)

### Modelos baseados em Yi 6B

Para Macs com Apple Silicon com 8GB+ de RAM

[Yi 6B Chat 🇨🇳](https://huggingface.co/01-ai/Yi-6B-Chat)

### Modelos baseados em Yi 34B

Para Macs com Apple Silicon com 24GB+ de RAM

[Yi 34B Chat 🇨🇳](https://huggingface.co/01-ai/Yi-34B-Chat)

Como podemos ajudar?

Se você tem uma dúvida ou está enfrentando um problema com o Private LLM, estamos aqui para ajudar. Basta preencher seus dados no formulário abaixo e entraremos em contato assim que possível.

Nome

E-mail

Como podemos ajudar você?Dúvida geralProblema técnico ou relato de bugFeedback ou sugestão

Selecione sua plataformaiOSiPadOSmacOS

Modelo do dispositivo

Mensagem

Enviar