DENZERAI

KI ohne Cloud: wann sich lokale Modelle für ein KMU lohnen

Eine Frage kommt in fast jedem Workshop: was ist mit dem Datenschutz, wenn ich meine Sachen in ChatGPT tippe? Bisher war meine ehrliche Antwort, dass lokale KI eine nette Demo ist, aber kein Werkzeug. Mit Modellen wie Gemma 4 12B stimmt das nicht mehr. Brauchbare KI läuft jetzt auf einem normalen Laptop, ohne dass ein Byte das Haus verlässt.

Christian Denzer Werkzeuge · Datenschutz

Warum die Frage überhaupt kommt

Wenn ein Steuerberater Mandantenzahlen in ein Chat-Tool tippt, eine Praxis Patientenbriefe formulieren lässt oder eine Personalabteilung Bewerbungen sortiert, dann gehen diese Daten an einen Server, meist in den USA. Für viele Fälle ist das mit einem ordentlichen Auftragsverarbeitungsvertrag sauber lösbar, und für die meisten KMU ist die Cloud weiterhin der einfachere, stärkere Weg. Aber es gibt Daten, die schlicht nicht raus dürfen, weil ein Mandantengeheimnis, eine Schweigepflicht oder eine interne Vorgabe das verbietet.

Bisher hieß meine Antwort in genau diesen Fällen: dann eben keine KI, oder nur für die unkritischen Teile. Lokale Modelle waren entweder zu schwach, um nützlich zu sein, oder brauchten teure Spezialhardware. Das hat sich in den letzten Monaten verschoben.

Was sich gerade geändert hat

Anfang Juni hat Google Gemma 4 12B veröffentlicht, ein offenes Modell, das genau in die Lücke zielt. Die Zahlen, die es interessant machen:

Wichtig ist die Erwartung. Ein lokales 12B-Modell ist nicht so klug wie das beste, was ChatGPT oder Claude in der Cloud anbieten. Bei kniffligem Schlussfolgern, langen Verträgen und echten Fachfragen merkt man den Abstand. Aber für Standardarbeit, also Texte glätten, zusammenfassen, sortieren, erste Entwürfe, ist es gut genug, und das auf Hardware, die viele ohnehin im Haus haben.

Wann lokal sinnvoll ist, wann nicht

Die Entscheidung ist keine Glaubensfrage, sondern hängt an der Art der Daten und der Aufgabe.

Lokal lohnt sich, wenn

Die Cloud bleibt besser, wenn

Der Reflex, alles aus Datenschutzangst lokal zu betreiben, ist genauso falsch wie der Reflex, alles in die Cloud zu kippen. Trenne deine Aufgaben in sensibel und unkritisch. Das Sensible bleibt lokal, der Rest läuft in der Cloud, die dort einfach stärker ist.

So fängst du klein an

Du musst dafür nichts kaufen und niemanden beauftragen. Ein Nachmittag reicht, um zu sehen, ob es für dich trägt.

Wenn der Test überzeugt, lohnt sich der nächste Schritt: das Modell fest in einen Ablauf einbauen, statt jedes Mal von Hand zu fragen. Wenn nicht, hast du einen Nachmittag investiert und weißt sicher, dass für deinen Fall die Cloud mit sauberem Vertrag der richtige Weg ist. Beides ist ein gutes Ergebnis.

Fazit

Lokale KI ist von der Demo zum Werkzeug geworden. Für die meisten Aufgaben bleibt die Cloud die einfachere und stärkere Wahl, daran ändert sich nichts. Aber für die Daten, die wirklich nicht raus dürfen, gibt es jetzt zum ersten Mal eine Antwort, die nicht "dann eben nicht" lautet. Mein Rat: trenne sauber zwischen sensibel und unkritisch, probier den lokalen Weg an einem konkreten Fall aus, und entscheide danach. Ich bin selbst noch dabei zu lernen, wo genau die Grenze für den Alltag liegt, aber dass die Option ernst geworden ist, steht für mich fest.

AI Sprint am 10. Juni in Husum

Halbtag, 349 Euro, 10 Plätze. Wir schauen deine Abläufe an, klären welche Daten in die Cloud dürfen und welche lokal bleiben, und nehmen einen Fall mit, der danach läuft.

Platz sichern

Quelle: Gemma 4 12B, multimodal und lokal auf handelsüblicher Hardware (the decoder, Juni 2026). Werkzeuge: Ollama, LM Studio. Eigene Erfahrung aus Workshops und Kunden-Setups, 2026.