Private LLM Privater, unzensierter KI-Chat für iPhone, iPad und Mac

Keine Cloud, Kein Tracking, Keine Logins.

KI offline auf deinem iPhone, iPad und Mac ausführen

Private LLM läuft komplett auf deinem iPhone, iPad oder Mac. Deine Unterhaltungen verlassen niemals das Gerät, und nach dem ersten Modell-Download ist kein Internet erforderlich. Kein Account, kein Tracking, keine Logs. Ein einmaliger Kauf schaltet die App auf jedem Apple-Gerät frei, das du besitzt, sowie für deine Familienfreigabe-Gruppe.
Eine Nahaufnahme eines iPhone-Bildschirms, der die Schnittstelle der Private LLM-App anzeigt, in der ein Textbefehl in eine Chat-ähnliche Schnittstelle eingegeben wird, was die Fähigkeit der App hervorhebt, ausgefeilte Sprachmodelle lokal auf dem Gerät für verbesserte Privatsphäre und Offline-Funktionalität auszuführen

DeepSeek R1, Llama 3.3, Qwen3 und Gemma 3 lokal ausführen

Private LLM führt die führenden Open-Source-Modelle direkt auf deinen Apple-Geräten aus - DeepSeek R1 Distill, Llama 3.3 70B, Qwen3 4B, Phi 4, Google Gemma 3 und mehr. Jede Unterhaltung bleibt on-device, und jedes Modell wird intern quantisiert, um die bestmögliche Qualität auf deiner Hardware zu gewährleisten.
Screenshot der Private LLM-App auf einem iPhone, der eine benutzerfreundliche Schnittstelle mit einer Liste herunterladbarer Large Language Models (LLMs) für die Offline-Nutzung anzeigt, wobei eine Vielzahl von Modellnamen und -beschreibungen gezeigt wird, die die Fähigkeit der App für personalisierte KI-Erlebnisse hervorheben und gleichzeitig ihre Privatsphäre und Offline-Funktionalität betonen.

Lokale KI in Siri und Apple Shortcuts - Ohne Code

Private LLM integriert sich direkt in Siri und die Shortcuts-App. Erstelle KI-gesteuerte Workflows, die Texte zusammenfassen, Texte generieren oder Antworten in eine der über 70 Apps weiterleiten, die die x-callback-url-Spezifikation unterstützen. Kein Code erforderlich.
Ein iPhone zeigt die Schnittstelle der Private LLM-App mit einer Apple Shortcut-Integration und zeigt eine nahtlose Benutzererfahrung für die Personalisierung von KI-Interaktionen auf iOS

Einmaliger Kauf, kein Abo - Familienfreigabe für sechs Personen

Verzichten Sie auf Abonnements für eine klügere Wahl mit Private LLM. Ein einzelner Kauf schaltet die App auf allen Apple-Plattformen frei – iPhone, iPad und Mac – und ermöglicht Family Sharing für bis zu sechs Verwandte. Dieser Ansatz vereinfacht nicht nur den Zugang, sondern erhöht auch den Wert Ihrer Investition und macht digitale Privatsphäre und Intelligenz universell in Ihrer Familie verfügbar.
Screenshot der Private LLM-Schnittstelle auf macOS, der einen Benutzer zeigt, der eine Aufforderung in das Texteingabefeld der Anwendung eingibt, bereit, sofortige Offline-Antworten vom lokalen Sprachmodell zu erhalten

In macOS integrierte KI-Schreibwerkzeuge

Wähle beliebigen Text in einer beliebigen macOS-App aus, mache einen Rechtsklick, und Private LLM schreibt ihn neu, fasst ihn zusammen oder korrigiert ihn - komplett on-device. Unterstützt Englisch und die wichtigsten westeuropäischen Sprachen.
Screenshot, der die Integration von Private LLM im systemweiten Dienstemenü von macOS zeigt.

Entwickelt von zwei Ingenieuren, nicht von VCs

Private LLM wird von zwei Ingenieuren in der EU entwickelt - bootstrapped, keine VC-Finanzierung, keine Growth-Hacking-Roadmap. Wir sind die einzige App im App Store mit OmniQuant- und GPTQ-Quantisierung, die messbar bessere Ergebnisse liefern als die RTN-Quantisierung, die von MLX- und llama.cpp-Wrapper-Apps wie Ollama und LM Studio verwendet wird. Wir sind unseren Nutzern verantwortlich, nicht Investoren - deshalb bleiben deine Daten on-device und werden es immer bleiben.
Ein iPhone zeigt die Schnittstelle der Private LLM-App mit einer Apple Shortcut-Integration und zeigt eine nahtlose Benutzererfahrung für die Personalisierung von KI-Interaktionen auf iOS

OmniQuant- und GPTQ-Quantisierung: Bessere Ergebnisse, weniger Speicherbedarf

Private LLM verwendet OmniQuant- und GPTQ-Quantisierung. Wenn LLMs für die On-Device-Inferenz quantisiert werden, beeinträchtigen Ausreißer-Gewichtungswerte die Qualität der Textgenerierung. OmniQuant moduliert Ausreißer-Gewichte mit einem lernbaren, optimierungsbasierten Clipping-Mechanismus, der den Quantisierungsfehler minimiert. GPTQ nutzt approximierte Informationen zweiter Ordnung (Hesse-Matrix), um den Rekonstruktionsfehler bei den wichtigsten Gewichten zu minimieren. Die affine RTN-Quantisierung, die von MLX-basierten Apps wie LM Studio verwendet wird, und die blockweisen RTN-Varianten, die von llama.cpp-basierten Apps wie Ollama verwendet werden, überspringen diese Art der Optimierung pro Gewicht - weshalb diese Apps auf derselben Apple-Hardware eine geringere Ausgabequalität liefern. Wir erforschen ständig fortschrittliche Quantisierungsmethoden, eine Arbeit, die Wrapper-Apps, die auf Inferenz-Engines von Drittanbietern basieren, nicht übernehmen können. OmniQuant und GPTQ in Kombination mit optimierten modellspezifischen Metal-Kerneln ermöglichen es Private LLM, eine Textgenerierung zu liefern, die auf Apple-Hardware sowohl schnell als auch von hoher Qualität ist.

Laden Sie die besten Open-Source-LLMs herunter

iOS

DeepSeek R1 Distill Basierte Modelle

Für iPhones/iPads mit 16GB+ RAM
DeepSeek R1 Distill Qwen 14B

Google Gemma 3 1B-basierte Modelle

Für iPhones/iPads mit 4GB+ RAM
Gemma 3 1B IT 💎Gemma 3 1B IT Abliterated (Uncensored)Amoral Gemma 3 1B v2 (Uncensored)

Google Gemma 2 2B-basierte Modelle

Für iPhones/iPads mit 4GB+ RAM
Gemma-2 2B IT 💎SauerkrautLM Gemma-2 2B IT

Qwen 2.5-basierte Modelle

Für iPhones/iPads mit 8GB+ RAM
Qwen 2.5 Coder 7B

Qwen 2.5 14B-basierte Modelle

Für iPhones/iPads mit 16GB+ RAM
Qwen 2.5 Coder 14BEVA Qwen2.5 14B v0.2 (Role-Play/Story Writing)

Phi-3 Mini 3.8B-basierte Modelle

Für iPhones/iPads mit 6GB+ RAM
Phi-3 Mini 4K InstructKappa-3 Phi Abliterated (Uncensored)

Google Gemma-basierte Modelle

Für iPhones/iPads mit 8GB+ RAM
Gemma 2B IT 💎Gemma 1.1 2B IT 💎

Llama 2 7B-basierte Modelle

Für iPhones/iPads mit 6GB+ RAM
Airoboros l2 7b 3.0Spicyboros 7b 2.2 🌶️

H2O Danube-basierte Modelle

Für iPhones/iPads mit 4GB+ RAM
H2O Danube 1.8B Chat

StableLM 3B Basierte Modelle

Für iPhones/iPads mit 4GB+ RAM
StableLM 2 Zephyr 1.6B 🪁Nous-Capybara-3B V1.9Rocket 3B 🚀

TinyLlama 1.1B Basierte Modelle

Für iPhones/iPads mit 4GB+ RAM
TinyLlama 1.1B Chat 🦙TinyDolphin 2.8 1.1B Chat 🐬

Yi 6B-basierte Modelle

Für iPhones/iPads mit 6GB+ RAM
Yi 6B Chat 🇨🇳
macOS

DeepSeek R1 Distill Basierte Modelle

Für Apple Silicon Macs mit 32GB+ RAM
Fuse O1 DeepSeek R1 QwQ SkyT1 32BDeepSeek R1 Distill Qwen 32B Abliterated (Uncensored)

DeepSeek R1 Distill Basierte Modelle

Für Apple Silicon Macs mit 48GB+ RAM
DeepSeek R1 Distill Llama 70BR1 1776 Distill Llama 70B

Google Gemma 3 1B-basierte Modelle

Für Apple Silicon Macs mit 8GB+ RAM
Gemma 3 1B IT 💎Gemma 3 1B IT Abliterated (Uncensored)Amoral Gemma 3 1B v2 (Uncensored)

Phi-4 14B-basierte Modelle

Für Apple Silicon Macs mit 16GB+ RAM
Phi-4

Meta Llama 3.1 70B-basierte Modelle

Für Apple Silicon Macs mit 64GB+ RAM
Meta Llama 3.1 70B Instruct 🦙

Qwen 2.5 14B-basierte Modelle

Für Apple Silicon Macs mit 16GB+ RAM
Qwen 2.5 Coder 14BEVA Qwen2.5 14B v0.2 (Role-Play/Story Writing)

Google Gemma 2 2B-basierte Modelle

Für Apple Silicon Macs mit 8GB+ RAM
Gemma-2 2B IT 💎SauerkrautLM Gemma-2 2B IT

Phi-3 Mini 3.8B-basierte Modelle

Für Apple Silicon Macs mit 8GB+ RAM
Phi-3 Mini 4K InstructKappa-3 Phi Abliterated (Uncensored)

Google Gemma-basierte Modelle

Für Apple Silicon Macs mit 8GB+ RAM
Gemma 2B IT 💎Gemma 1.1 2B IT 💎

Mixtral 8x7B-basierte Modelle

Für Apple Silicon Macs mit 32GB+ RAM
Mixtral-8x7B-Instruct-v0.1Dolphin 2.6 Mixtral 8x7B 🐬Nous Hermes 2 Mixtral 8x7B DPO ☤

Llama 33B-basierte Modelle

Für Apple Silicon Macs mit 24GB+ RAM
WizardLM 33B v1.0 (Uncensored)

Llama 2 13B-basierte Modelle

Für Apple Silicon Macs mit 16GB+ RAM
Wizard LM 13BSpicyboros 13B 🌶️Synthia 13B 1.2XWin-LM-13BMythomax L2 13B

CodeLlama 13B-basierte Modelle

Für Apple Silicon Macs mit 16GB+ RAM
WhiteRabbitNeo-13B-v1

Llama 2 7B-basierte Modelle

Für Apple Silicon Macs mit 8GB+ RAM
airoboros-l2-7b-3.0Spicyboros 7b 2.2 🌶️Xwin-LM-7B v0.1

Solar 10.7B-basierte Modelle

Für Apple Silicon Macs mit 16GB+ RAM
Nous-Hermes-2-SOLAR-10.7B ☤

Phi-2 3B-basierte Modelle

Für Apple Silicon Macs mit 8GB+ RAM
Phi-2 Orange 🍊Phi-2 Orange Version 2 🍊Dolphin 2.6 Phi-2 (Uncensored) 🐬

StableLM 3B Basierte Modelle

Für Apple Silicon Macs mit 8GB+ RAM
StableLM Zephyr 3B 🪁

Yi 6B-basierte Modelle

Für Apple Silicon Macs mit 8GB+ RAM
Yi 6B Chat 🇨🇳

Yi 34B-basierte Modelle

Für Apple Silicon Macs mit 24GB+ RAM
Yi 34B Chat 🇨🇳
Wie können wir helfen?

Egal ob Sie eine Frage haben oder ein Problem mit Private LLM – wir sind für Sie da. Geben Sie einfach Ihre Daten im untenstehenden Formular ein, und wir melden uns so schnell wie möglich bei Ihnen.