Private LLM Chat de IA privado e sem censura para iPhone, iPad e Mac

Sem nuvem, sem rastreamento, sem logins.

Execute IA offline no seu iPhone, iPad e Mac

O Private LLM roda inteiramente no seu iPhone, iPad ou Mac. Suas conversas nunca saem do dispositivo e não é necessária internet após o download inicial do modelo. Sem conta, sem rastreamento, sem logs. Uma compra desbloqueia o app em todos os seus dispositivos Apple e no seu grupo de Compartilhamento Familiar.

Uma visão em close da tela de um iPhone exibindo a interface do app Private LLM, onde um prompt de texto é inserido em uma interface de chat, destacando a capacidade do app de executar modelos de linguagem sofisticados localmente no dispositivo para maior privacidade e funcionalidade offline

Execute DeepSeek R1, Llama 3.3, Qwen3 e Gemma 3 localmente

O Private LLM executa os principais modelos de código aberto diretamente nos seus dispositivos Apple — DeepSeek R1 Distill, Llama 3.3 70B, Qwen3 4B, Phi 4, Google Gemma 3 e mais. Cada conversa permanece no dispositivo e cada modelo é quantizado internamente para a melhor qualidade possível no seu hardware.

Encontre os melhores LLMs de código aberto para o seu dispositivo

Captura de tela do app Private LLM em um iPhone, exibindo uma interface amigável com uma lista de Large Language Models (LLMs) disponíveis para download para uso offline, mostrando uma variedade de nomes e descrições de modelos, enfatizando a capacidade do app para experiências de IA personalizadas enquanto destaca sua privacidade e funcionalidade offline.

IA local no Siri e Apple Shortcuts — Sem código

O Private LLM se conecta diretamente ao Siri e ao app Shortcuts. Crie fluxos de trabalho baseados em IA para resumir textos, gerar textos ou enviar respostas para qualquer um dos mais de 70 apps que suportam a especificação x-callback-url. Nenhum código é necessário.

Veja Apple Shortcuts criados por usuários para o Private LLM

Um iPhone exibindo a interface do app Private LLM com uma integração de Apple Shortcut, mostrando uma experiência de usuário fluida para personalizar interações de IA no iOS

Uma compra, sem assinatura — Compartilhamento Familiar para seis

Abandone as assinaturas por uma escolha mais inteligente com o Private LLM. Uma única compra desbloqueia o app em todas as plataformas Apple — iPhone, iPad e Mac — permitindo o Compartilhamento Familiar para até seis parentes. Essa abordagem simplifica o acesso e amplia o valor do seu investimento, tornando a privacidade e a inteligência digital universalmente disponíveis para sua família.

Captura de tela da interface do Private LLM no macOS, apresentando um usuário digitando um prompt no campo de entrada de texto do aplicativo, pronto para receber respostas instantâneas e offline do modelo de linguagem local

Ferramentas de escrita com IA integradas ao macOS

Selecione qualquer texto em qualquer app do macOS, clique com o botão direito e o Private LLM reescreve, resume ou corrige — inteiramente no dispositivo. Suporta inglês e os principais idiomas da Europa Ocidental.

Captura de tela mostrando a integração do Private LLM no menu de serviços do sistema macOS.

Criado por dois engenheiros, não por VCs

O Private LLM foi criado por dois engenheiros na UE — financiado por conta própria, sem capital de risco, sem roteiro de crescimento forçado. Somos o único app na App Store com quantização OmniQuant e GPTQ, que produzem resultados comprovadamente melhores do que a quantização RTN usada por apps baseados em MLX e llama.cpp, como Ollama e LM Studio. Respondemos aos usuários, não a investidores — é por isso que seus dados permanecem no dispositivo e sempre permanecerão.

Da App Store

Avaliações reais de usuários de iPhone e Mac

“This is a private AI app created by developers performing constant updates and not charging a subscription. That is rare nowadays! Bravo, looking forward to the updates as this continues to improve!”

🇺🇸8parental8 · Avaliação da App Store

Leia as avaliações da App Store

Quantização OmniQuant e GPTQ: Melhor resultado, menos memória

O Private LLM usa OmniQuant e quantização GPTQ. Quando LLMs são quantizados para inferência no dispositivo, valores de peso discrepantes prejudicam a qualidade da geração de texto. O OmniQuant modula pesos discrepantes com um mecanismo de corte baseado em otimização que minimiza o erro de quantização. O GPTQ usa informações de segunda ordem (Hessiana) aproximadas para minimizar o erro de reconstrução nos pesos mais importantes. A quantização RTN afim usada por apps baseados em MLX, como o LM Studio, e as variantes RTN em blocos usadas por apps baseados em llama.cpp, como o Ollama, ignoram esse tipo de otimização por peso — é por isso que esses apps produzem resultados de menor qualidade no mesmo hardware Apple. Exploramos constantemente métodos avançados de quantização, um trabalho que apps baseados em motores de inferência de terceiros não podem realizar. OmniQuant e GPTQ, combinados com kernels Metal otimizados para modelos específicos, permitem que o Private LLM entregue uma geração de texto rápida e de alta qualidade no hardware Apple.

Private LLM vs Ollama

Baixe os melhores LLMs de código aberto

iOS

Modelos baseados em Qwen3 4B

Para iPhones/iPads com 6GB+ de RAM

Qwen3 4B Instruct 2507 Qwen3 4B Instruct 2507 Abliterated (Uncensored)Josiefied Qwen3 4B Instruct 2507 (Uncensored)Qwen3 4B Instruct 2507 Heretic (Uncensored)Qwen3 4B Instruct 2507 Heretic NoSlop (Uncensored)

Modelos baseados em DeepSeek R1 Distill

Para iPhones/iPads com 8GB+ de RAM

DeepSeek R1 Distill Llama 8B DeepSeek R1 Distill Qwen 7B DeepSeek R1 Distill Llama 8B Abliterated (Uncensored)

Modelos baseados em DeepSeek R1 Distill

Para iPhones/iPads com 16GB+ de RAM

DeepSeek R1 Distill Qwen 14B

Modelos baseados em Meta Llama 3.2 3B

Para iPhones/iPads com 6GB+ de RAM

Meta Llama 3.2 3B Instruct 🦙Llama 3.2 3B Instruct Abliterated 🦙 (Uncensored)Llama 3.2 3B Instruct Uncensored 🦙Hermes 3 Llama 3.2 3B FuseChat Llama 3.2 3B Instruct Dolphin 3.0 Llama 3.2 3B 🐬 (Uncensored)

Modelos baseados em Meta Llama 3.2 1B

Para iPhones/iPads com 4GB+ de RAM

Meta Llama 3.2 1B Instruct 🦙Llama 3.2 1B Instruct Abliterated 🦙 (Uncensored)FuseChat Llama 3.2 1B Instruct Dolphin 3.0 Llama 3.2 1B 🐬 (Uncensored)

Modelos baseados em Google Gemma 3 1B

Para iPhones/iPads com 4GB+ de RAM

Gemma 3 1B IT 💎Gemma 3 1B IT Abliterated (Uncensored)Amoral Gemma 3 1B v2 (Uncensored)

Modelos baseados em Google Gemma 2 9B

Para iPhones/iPads com 16GB+ de RAM

Gemma-2 9B IT 💎Gemma-2 9B IT SPPO Iter3 Tiger Gemma 9B v3 🐅 (Uncensored)FuseChat Gemma 2 9B Instruct Gemma 2 Ifable 9B (Creative Writing)

Modelos baseados em Google Gemma 2 2B

Para iPhones/iPads com 4GB+ de RAM

Gemma-2 2B IT 💎SauerkrautLM Gemma-2 2B IT

Modelos baseados em Meta Llama 3.1 8B

Para iPhones/iPads com 8GB+ de RAM

Meta Llama 3.1 8B Instruct 🦙Meta Llama 3.1 8B Instruct Abliterated 🦙(Uncensored)Hermes 3 Llama 3.1 8B FuseChat Llama 3.1 8B Instruct Llama 3.1 8B Lexi Uncensored V2 (Therapy/Role-Play)Dolphin 3.0 Llama 3.1 8B 🐬 (Uncensored)Meta Llama 3.1 8B Survive V3 (Survival Specialist)Llama 3.1 8B UltraMedical 🏥 (Biomedical)

Modelos baseados em Meta Llama 3 8B

Para iPhones/iPads com 6GB+ de RAM

Meta Llama 3 8B Instruct 🦙Meta Llama 3 8B Instruct Abliterated v3 (Uncensored)NeuralDaredevil 8B Abliterated (Uncensored)Llama 3 8B Instruct MopeyMule Llama 3 WhiteRabbitNeo 8B v2.0 Hermes 2 Theta Llama 3 8B LLaMA3-iterative-DPO-final Hathor_Stable-v0.2-L3-8B Openchat 3.6 8B 20240522 Dolphin 2.9 Llama 3 8B (Uncensored) 🐬Llama 3 Smaug 8B Hermes 2 Pro Llama 3 8B ☤OpenBioLLM-8B 🧬 (Biomedical)L3 Umbral Mind RP v3.0 8B 🌓Llama 3 Instruct 8B SPPO Iter3

Modelos baseados em Qwen 2.5

Para iPhones/iPads com 4GB+ de RAM

Qwen 2.5 0.5B Unquantized Qwen 2.5 Coder 0.5B Unquantized Dolphin 3.0 Qwen 2.5 0.5B 🐬 (Uncensored)Qwen 2.5 1.5B Qwen 2.5 Coder 1.5B EVA-D Qwen2.5 1.5B v0.0 (Role-Play/Story Writing)Dolphin 3.0 Qwen 2.5 1.5B 🐬 (Uncensored)Qwen 2.5 3B Qwen 2.5 Coder 3B Dolphin 3.0 Qwen 2.5 3B 🐬 (Uncensored)

Modelos baseados em Qwen 2.5

Para iPhones/iPads com 8GB+ de RAM

Qwen 2.5 7B FuseChat Qwen 2.5 7B Instruct EVA Qwen2.5 7B v0.1 (Role-Play/Story Writing)OpenHands LM 7B v0.1 (Coding)

Modelos baseados em Qwen 2.5

Para iPhones/iPads com 8GB+ de RAM

Qwen 2.5 Coder 7B

Modelos baseados em Qwen 2.5 14B

Para iPhones/iPads com 16GB+ de RAM

Qwen 2.5 Coder 14B EVA Qwen2.5 14B v0.2 (Role-Play/Story Writing)

Modelos baseados em Phi-3 Mini 3.8B

Para iPhones/iPads com 6GB+ de RAM

Phi-3 Mini 4K Instruct Kappa-3 Phi Abliterated (Uncensored)

Modelos baseados em Google Gemma

Para iPhones/iPads com 8GB+ de RAM

Gemma 2B IT 💎Gemma 1.1 2B IT 💎

Modelos baseados em Mistral 7B

Para iPhones/iPads com 6GB+ de RAM

Mistral 7B Instruct v0.3 Mistral 7B Instruct v0.2 OpenHermes 2.5 Mistral 7B ☤Hermes 2 Pro Mistral 7B ☤RakutenAI 7B Chat 🇯🇵openchat-3.5-0106 7B 💬CodeNinja 1.0 OpenChat 7B 🥷Starling LM 7B Beta 🐤Dolphin 2.8 Mistral 7B v0.2 (Uncensored) 🐬DictaLM 2.0 Instruct 🇮🇱

Modelos baseados em Llama 2 7B

Para iPhones/iPads com 6GB+ de RAM

Airoboros l2 7b 3.0 Spicyboros 7b 2.2 🌶️

Modelos baseados em Phi-2 3B

Para iPhones/iPads com 4GB+ de RAM

Phi-2 Orange 🍊Dolphin 2.6 Phi-2 (Uncensored) 🐬Phi-2 Super 🤖Phi-2 Orange v2 🍊

Modelos baseados em H2O Danube

Para iPhones/iPads com 4GB+ de RAM

H2O Danube 1.8B Chat

Modelos baseados em StableLM 3B

Para iPhones/iPads com 4GB+ de RAM

StableLM 2 Zephyr 1.6B 🪁Nous-Capybara-3B V1.9 Rocket 3B 🚀

Modelos baseados em TinyLlama 1.1B

Para iPhones/iPads com 4GB+ de RAM

TinyLlama 1.1B Chat 🦙TinyDolphin 2.8 1.1B Chat 🐬

Modelos baseados em Yi 6B

Para iPhones/iPads com 6GB+ de RAM

Yi 6B Chat 🇨🇳

macOS

Modelos baseados em DeepSeek R1 Distill

Para Macs com Apple Silicon com 16GB+ de RAM

DeepSeek R1 Distill Llama 8B DeepSeek R1 Distill Llama 8B Abliterated (Uncensored)DeepSeek R1 Distill Qwen 7B DeepSeek R1 Distill Qwen 14B

Modelos baseados em DeepSeek R1 Distill

Para Macs com Apple Silicon com 32GB+ de RAM

Fuse O1 DeepSeek R1 QwQ SkyT1 32B DeepSeek R1 Distill Qwen 32B Abliterated (Uncensored)

Modelos baseados em DeepSeek R1 Distill

Para Macs com Apple Silicon com 48GB+ de RAM

DeepSeek R1 Distill Llama 70B R1 1776 Distill Llama 70B

Modelos baseados em Google Gemma 3 1B

Para Macs com Apple Silicon com 8GB+ de RAM

Gemma 3 1B IT 💎Gemma 3 1B IT Abliterated (Uncensored)Amoral Gemma 3 1B v2 (Uncensored)

Modelos baseados em Phi-4 14B

Para Macs com Apple Silicon com 16GB+ de RAM

Phi-4

Modelos baseados em Meta Llama 3.3 70B

Para Macs com Apple Silicon com 48GB+ de RAM

Meta Llama 3.3 70B Instruct 🦙Llama 3.3 70B Instruct Abliterated (Uncensored)EVA LLaMA 3.33 70B v0.1 (Role-Play/Story Writing)Llama 3.3 70B Euryale v2.3 (Role-Play/Story Writing)

Modelos baseados em Meta Llama 3.2 3B

Para Macs com Apple Silicon com 8GB+ de RAM

Meta Llama 3.2 3B Instruct 🦙Dolphin 3.0 Llama 3.2 3B 🐬 (Uncensored)Llama 3.2 3B Instruct Abliterated 🦙 (Uncensored)Llama 3.2 3B Instruct Uncensored 🦙Hermes 3 Llama 3.2 3B FuseChat Llama 3.2 3B Instruct

Modelos baseados em Meta Llama 3.2 1B

Para Macs com Apple Silicon com 8GB+ de RAM

Meta Llama 3.2 1B Instruct 🦙Dolphin 3.0 Llama 3.2 1B 🐬 (Uncensored)Llama 3.2 1B Instruct Abliterated 🦙 (Uncensored)FuseChat Llama 3.2 1B Instruct

Modelos baseados em Meta Llama 3.1 70B

Para Macs com Apple Silicon com 64GB+ de RAM

Meta Llama 3.1 70B Instruct 🦙

Modelos baseados em Meta Llama 3.1 8B

Para Macs com Apple Silicon com 8GB+ de RAM

Modelos baseados em Qwen 2.5

Para Macs com Apple Silicon com 8GB+ de RAM

Qwen 2.5 0.5B Unquantized Qwen 2.5 1.5B Qwen 2.5 3B Qwen 2.5 7B Qwen 2.5 Coder 0.5B Unquantized Qwen 2.5 Coder 1.5B Qwen 2.5 Coder 3B Qwen 2.5 Coder 7B FuseChat Qwen 2.5 7B Instruct EVA-D Qwen2.5 1.5B v0.0 (Role-Play/Story Writing)EVA Qwen2.5 7B v0.1 (Role-Play/Story Writing)Dolphin 3.0 Qwen 2.5 0.5B 🐬 (Uncensored)Dolphin 3.0 Qwen 2.5 1.5B 🐬 (Uncensored)Dolphin 3.0 Qwen 2.5 3B 🐬 (Uncensored)

Modelos baseados em Qwen 2.5 14B

Para Macs com Apple Silicon com 16GB+ de RAM

Qwen 2.5 Coder 14B EVA Qwen2.5 14B v0.2 (Role-Play/Story Writing)

Modelos baseados em Qwen3 4B

Para Macs com Apple Silicon com 16GB+ de RAM

Modelos baseados em Qwen 2.5 32B

Para Macs com Apple Silicon com 24GB+ de RAM

Qwen 2.5 32B Qwen 2.5 Coder 32B EVA Qwen2.5 32B v0.2 (Role-Play/Story Writing)OpenHands LM 32B v0.1 (Coding)

Modelos baseados em Google Gemma 2 9B

Para Macs com Apple Silicon com 16GB+ de RAM

Gemma-2 9B IT 💎Gemma-2 9B IT SPPO Iter3 Tiger Gemma 9B v3 🐅 (Uncensored)FuseChat Gemma 2 9B Instruct Gemma 2 Ifable 9B (Creative Writing)

Modelos baseados em Google Gemma 2 2B

Para Macs com Apple Silicon com 8GB+ de RAM

Gemma-2 2B IT 💎SauerkrautLM Gemma-2 2B IT

Modelos baseados em Meta Llama 3 70B

Para Macs com Apple Silicon com 48GB+ de RAM

Meta Llama 3 70B Instruct 🦙Smaug Llama 3 70B Instruct Smaug Llama 3 70B Instruct Abliterated v3 (Uncensored)Cat Llama 3 70B Instruct

Modelos baseados em Meta Llama 3 8B

Para Macs com Apple Silicon com 8GB+ de RAM

Modelos baseados em Phi-3 Mini 3.8B

Para Macs com Apple Silicon com 8GB+ de RAM

Phi-3 Mini 4K Instruct Kappa-3 Phi Abliterated (Uncensored)

Modelos baseados em Google Gemma

Para Macs com Apple Silicon com 8GB+ de RAM

Gemma 2B IT 💎Gemma 1.1 2B IT 💎

Modelos baseados em Mixtral 8x7B

Para Macs com Apple Silicon com 32GB+ de RAM

Mixtral-8x7B-Instruct-v0.1 Dolphin 2.6 Mixtral 8x7B 🐬Nous Hermes 2 Mixtral 8x7B DPO ☤

Modelos baseados em Llama 33B

Para Macs com Apple Silicon com 24GB+ de RAM

WizardLM 33B v1.0 (Uncensored)

Modelos baseados em Llama 2 13B

Para Macs com Apple Silicon com 16GB+ de RAM

Wizard LM 13B Spicyboros 13B 🌶️Synthia 13B 1.2 XWin-LM-13B Mythomax L2 13B

Modelos baseados em CodeLlama 13B

Para Macs com Apple Silicon com 16GB+ de RAM

WhiteRabbitNeo-13B-v1

Modelos baseados em Llama 2 7B

Para Macs com Apple Silicon com 8GB+ de RAM

airoboros-l2-7b-3.0 Spicyboros 7b 2.2 🌶️Xwin-LM-7B v0.1

Modelos baseados em Solar 10.7B

Para Macs com Apple Silicon com 16GB+ de RAM

Nous-Hermes-2-SOLAR-10.7B ☤

Modelos baseados em Phi-2 3B

Para Macs com Apple Silicon com 8GB+ de RAM

Phi-2 Orange 🍊Phi-2 Orange Version 2 🍊Dolphin 2.6 Phi-2 (Uncensored) 🐬

Modelos baseados em StableLM 3B

Para Macs com Apple Silicon com 8GB+ de RAM

StableLM Zephyr 3B 🪁

Modelos baseados em Yi 6B

Para Macs com Apple Silicon com 8GB+ de RAM

Yi 6B Chat 🇨🇳

Modelos baseados em Yi 34B

Para Macs com Apple Silicon com 24GB+ de RAM

Yi 34B Chat 🇨🇳

Como podemos ajudar?

Se você tem uma dúvida ou está enfrentando um problema com o Private LLM, estamos aqui para ajudar. Basta preencher seus dados no formulário abaixo e entraremos em contato assim que possível.