[en] [de] Vibe Coding: Ein Experiment

19 Oct

Vibe Coding: Ein Experiment

(Übersetzt aus dem Englischen: /en/vibe-coding-an-experiment )

Bevor ich überhaupt anfange, über dieses Thema zu schreiben, sollte ich wohl erwähnen, dass dieser Artikel nicht mit KI erstellt wurde. Kein einziges Wort. (mit einer Ausnahme: Die deutsche übersetzung wurde automatisch mit Claude erstellt und dann von mir manuell überarbeitet) Ich habe auch versucht, möglichst auf unnötiges Techtalk zu verzichten, da ich denke dass es auch für nicht C#-Entwickler interessant sein könnte. Jede Programmiererfahrung hilft, ist aber nicht erforderlich. Wenn Du andererseits ein erfahrener Entwickler bist, sei nicht genervt, wenn ich Dinge erkläre, die Dir trivial erscheinen; ignoriere die Erklärungen einfach und fühle Dich schlau :)

Regelwerk

Ich wollte testen, wie gut Vibe Coding (Die Anwendung komplett durch die KI erstellen zu lassen) mit einem praktischen Beispiel mittlerweile funktioniert. Kommt das heraus, was ich möchtel? Ist die Codequalität gut? Würde es jemandem helfen, der überhaupt keine Programmierkenntnisse besitzt? Um das herauszufinden habe ich ein Regelwerk aufgestellt:

Sicherstellen, dass das, was ich erreichen will, noch nicht zuvor gemacht wurde (damit die KI nicht einfach eine komplette Anwendung kopieren/einfügen kann)
NICHT CODEN: Wirklich. Ich versuche, kein einziges Zeichen in einer Quelldatei zu ändern, selbst wenn ein Fehler offensichtlich ist. Da muss die KI selber durch
Versuchen, nicht zu helfen: Wenn ein Fehler auftritt erkläre ich es der KI, aber die Ursache möchte ich nicht erklären. Claude soll erst einmal herausfinden, wie das Problem zu lösen ist. Ich helfe nur, wenn es denn gar nicht mehr anders geht
Die Anwendung sollte nicht zu einfach sein (kein "Hello World")
Die Anwendung sollte auch nicht zu kompliziert sein (kein "Bitte erstelle eine bessere Microsoft Teams-Anwendung")
Keine externen Tools benötigt; Also keine Unity- oder Photoshop-Anforderungen usw. Alles soll sich in der IDE (Rider) abspielen
Kein Passwort-Hashing, keine Speicherung von Secrets. Ich will den Code und die Applikation unverändert veröffentlichen und traue schlicht der KI nicht genug um das Risiko einzugehen dass da furchtbare Dinge passieren

Umgebung und Aufgabenbeschreibung

Ich habe Rider mit Claude AI-Integration und Sonnet 4 verwendet. Wann immer Claude mich um Erlaubnis fragte etwas zu tun, habe ich sie gewährt. Ich begann mit einer einfachen Aufgabe und iterierte im Laufe der Zeit. Die Aufgabe war:

Erstelle eine Razor-Anwendung, die eine SCRUM-Poker-Funktionalität mit einem Spin bietet: Sie soll Joker-Mechaniken wie in Balatro haben. Der PO sollte in der Lage sein, ein neues Spiel zu erstellen. Dann sollte eine Admin-Ansicht und eine Spieler-Ansicht erstellt werden. Jede von ihnen durch Generierung eines zufälligen Codes wie play?code=dbddhkp und admin?code=ukule2. Keine Datenbank. Speichere einfach alles im Arbeitsspeicher

Anforderung eins ist damit erfüllt: Das ist sicher noch nie zuvor gemacht worden, weil es absolut keinen Sinn ergibt 😀 . SCRUM-Poker ist ein Werkzeug, um die "Kosten" (oder Komplexität) von Programmieraufgaben zu bestimmen. Jeder Entwickler entscheidet, wie komplex die anstehende Aufgabe ist, üblicherweise mit Werten von 1 bis 21 und am Ende werden diese Werte verglichen und diskutiert. Der Hauptgrund ist, dass die Zahl selbst nicht offen am Anfang kommuniziert wird, sodass, wenn ein Senior-Entwickler seine Zahl sagt, andere Entwickler nicht einfach sagen "jepp. Ungefähr das Gleiche". Das "Poker"-Element stellt sicher, dass jeder die Zahl sagt, an die er oder sie wirklich denkt, und danach werden Diskrepanzen diskutiert.

Balatro hingegen ist ein lustiges Poker-Spiel. Es gibt Joker, die den Wert der Karten verändern. Z.B. "jedes Herz wird mit 4 multipliziert". Offensichtlich würde dies alle nützlichen Ergebnisse verhindern, die das SCRUM-Poker produziert hat. Also ein Unsinnsprojekt, nichtsdestotrotz ein nicht ganz Triviales.

Ich habe später zusätzliche Funktionen hinzugefügt, wie eine Mehrsprachenfunktion, wollte aber der KI die Chance geben, zu iterieren.

Hat es funktioniert?

Die kurze Antwort ist: Ja. Ich habe keine einzige Zeile Code geschrieben und die Anwendung funktionierte im Kern.

Aber die lange Antwort ist: Entwickler werden ihren Job nicht so schnell verlieren. Wie ich in den Erkenntnissen zeigen werde, erfordert es einen erfahrenen Entwickler, in die richtige Richtung zu führen, wenn Probleme gelöst werden müssen. Außerdem führen einige Entscheidungen zu schlechtem Code. Die detaillierten Fallstricke und auch positiven Überraschungen findest Du in den Erkenntnissen.

Der größte Vorteil: Ich bin Backend-Entwickler. Meine Programme funktionieren (normalerweise), aber ich bin nicht wirklich gut in UI oder UX. Dieses Defizit konnte die KI gut lösen. Es war jetzt optisch keine Offenbarung, sah aber besser aus als wenn ich es selbst hätte designen müssen.

![Spieler-Ansicht: Es gibt einen Willkommenstext, einige Spielkarten werden angezeigt. Die Namen anderer Spieler sind zu sehen und die ausgewählten Punkte (21) erscheinen](Screenshot%20from%202025-10-18%2015-54-54.png"Spieler-Bildschirm in der Spielphase") Spieler-Ansicht: Das Spiel ist beendet. Ein Joker ist erschienen (Wrathful Joker). Die Punktzahlen aller Spieler werden angezeigt

Admin-Ansicht: Die ausgewählten Karten jedes Spielers und die Joker werden angezeigt

Quellen und Demonstration

Du findest die Quellen im FiboNuts Repository auf Github. Ein funktionierendes Beispiel findest Du unter Poker.Oles.Cloud

Erkenntnisse

Codequalität

Die Codequalität begann gut, wurde aber schlechter, völlig falsche Annahmen führten zu schlechtem Code. Claude zu zwingen, diese Dinge rückgängig zu machen, half, den Code wieder in gute Form zu bringen. Um ehrlich zu sein, hatte ich Schlimmeres erwartet

Hilfe benötigt

Ziemlich am Anfang des Projekts stieß ich auf ein Problem, das die KI selbst nicht lösen konnte: Es werden URLs für die Spieler generiert. Aber wenn ich diese in einem anderen Browser (oder auch nur Tab) eingebe, wird der Code nicht erkannt. Ich versuchte Claude in etwa 10 Iterationen zu sagen, dass es nicht funktioniert. Die KI versuchte verschiedene Ansätze, kam aber nie einer Lösung nahe. Nachdem ich den Hinweis gab, dass es ein Problem in der Dependency-Injection-Implementierung gibt und die Zustands-Klasse, die, nicht als Scoped, sondern als Singleton hinzugefügt werden sollte, konnte sie fortfahren. Aber ohne meine Hilfe wäre dies das Ende des Projekts gewesen.

Es war überraschend zu sehen, dass eine solch einfache Ursache nicht erkannt werden konnte, während viel komplexere Probleme gelöst wurden.

An einer anderen Stelle funktionierte die Kommunitkation zwischen dem Admin und den Spielern nicht. Es wirkte fast so als würde Claude mir nicht glauben. Nach mehreren erfolglosen Versuchen bot ich dann an, dass Claude doch logs schreiben könne, die ich dann in den Prompt poste, damit die KI das Problem analysieren kann. Das funktionierte dann.

Screenshot der KI-Konsole, der die vorzunehmenden Änderungen zeigt

Zufällige Dinge hinzufügen

Claude entschied auch irgendwann, https hinzuzufügen. (Es war vorher eine reine http-Anwendung), als ich darum bat, eine Mehrsprachenfunktion hinzuzufügen. Ich vermute, er lernte die Implementierung dieser Funktion von einer Seite, auf der https verwendet wurde. Der https-Teil hat die Anwendung komplett zerstört, weil Ports in der Konfiguration mehrfach zugewiesen worden waren.

Auch bis zum Ende gab es immer einen hässlichen "About"-Link im oberen Teil der Seite, der zu https://learn.microsoft.com/en-us/aspnet/core/?view=aspnetcore-9.0 führte. Ich vermute, das ist Teil jedes "Wie erstelle ich eine Blazor-Anwendung"-Tutorials, und so dachte Claude, das sei erforderlich

Falsche Annahmen

An einem Punkt bat ich die KI, eine Mehrsprachenfunktion mit Best Practices hinzuzufügen. Während sie das korrekt tat, vergaß sie ein entscheidendes Paket von NuGet hinzuzufügen. Die Build-Fehler waren ziemlich offensichtlich ("Are you missing a reference?". Dennoch nahm Claude stattdessen an, dass der generierte Code zu komplex für den Compiler war (was er absolut nicht war), und entfernte einfach immer wieder seinen Code, bis das Programm wieder kompilierte, aber auch die ursprüngliche Multi-Language-Funktion nicht mehr vorhanden war . Wieder musste ich helfen und ihm sagen: "Hey. Das war nicht das Problem. Du hast einige NuGet-Pakete vergessen". Danach wurde das Problem gelöst.

An einem anderen Punkt gelang es Claude, die Anwendung komplett zu zerstören. Direkt beim Start wurde sie einfach nicht mehr geladen, nachdem der Fortschrittsbalken fertig war. Claude machte eine Annahme, die kein Entwickler machen würde: Er war sich sicher, dass die Ursache das Logging war. Zu viele Log-Einträge, die die Anwendung verlangsamen. Also wurde jedes Log in jeder Exception-Behandlung oder sonst wo entfernt. Das Problem wurde offensichtlich nicht gelöst, aber es wurde eine viel schlechtere Variante als zuvor erstellt.

Als Faustregel: Wann immer der Bot etwas schreibt wie "this is a known issue of", hat er wahrscheinlich einen sehr seltsamen Grenzfall gefunden, der nichts mit dem Problem zu tun hat. In meinem Fall führte die nicht funktionierende Mehrsprachigkeit zu wirklich seltsamen Aktionen: DLLs für jede Sprache erstellen, versuchen, Reflection zu verwenden, um ein (nicht existierendes) Problem des Localizers zu beheben. Dabei war das Problem ein simples: Auf der HTML-Seite stand schlicht immer noch der statische Text anstatt die Localizer-Funktion aufzurufen. Nachdem ich der KI das mitteilte konnte sie wieder richtig abbiegen.

Was ist einfach?

Aufgaben, die ich als vergleichsweiese umfangreich ansehe, wurden manchmal ohne Probleme gelöst, während andere, sehr simple Aufgaben unlösbar schienen. Zum Beispiel wollte ich einen '/metrics'-Endpunkt, der mit Prometheus (ein Tool zum Sammeln von Metriken und deren Anzeige in einem Grafana Dashboard) verwendet werden sollte. Obwohl die Seite optisch richtig aussah, war es eine HTML-Seite, die den Inhalt in einem PRE-Tag renderte. Claude schaffte es nie, die einfache Aufgabe zu befolgen: "Bitte gib reinen Text aus. Keine HTML-Tags." Selbst wenn ich versuchte mit dem korrekten Mimetype zu unterstützen, verstand es immer noch nicht richtig.

Es wurden absurde Dinge versucht, wie eine zweite Server Anwendung zum Sammeln der Metriken, es wurde IIS und IIS Express - Konfigurationen erstellt, die alle das Programm viel, viel schlechter machten, sich aber keinen Zentimeter zur Lösung "lass doch einfach die html tags weg" bewegten,

Danach war Claude so verwirrt, dass nicht einmal das Zurückrollen funktionierte. Die KI konnte ihre Dateien nicht mehr finden und versuchte sogar, sie in Bereichen meines Computers zu finden, wo sie nicht suchen sollte: Chat mit KI, um Dinge rückgängig zu machen. Die KI versucht dann, die Dateien zu finden, die sie gerade erstellt hat, scheitert aber

ScreenshotClaude versucht, auf einen Ordner über dem Projekt zuzugreifen

Unnötig zu erwähnen, dass diese Operationen kostspielig waren: Nachricht, dass das Tageslimit erreicht wurde

Nach ein paar Wiederholungsversuchen musste ich aufgeben. Claude war nie in der Lage, eine einfache Ausgabe in text/plain zu erstellen. Selbst wenn ich Beispiel-Snippets gab. Es renderte immer HTML, das wie Text aussah, aber immer noch HTML-Tags hatte.

Interessante Taktiken

Nachdem die Anwendung beim (unverlangten) Hinzufügen von https kaputt ging, tat Claude einige interessante Dinge. Er analysierte nicht einfach den Code, sondern war sich sicher, dass es nicht seine Schuld war :) Stattdessen nahm er an, dass es eine andere Anwendung geben muss, die das Problem verursacht, und startete daher nmap, um zu analysieren, welche anderen Dienste auf meinem Rechner schuld sein könnten.

Ich hatte nicht erwartet dass Claude aus meiner IDE "auszubrechen" würde. Eine Erinnerung daran, nicht einfach alles zu erlauben, sondern alle Aktionen genau zu beobachten. Ich wäre nicht überrascht gewesen, wenn Claude entschieden hätte, diesen anderen Prozess einfach zu beenden, wenn es wirklich einen externen Dienst auf dem Port gegeben hätte.

Fazit/Meinung

Vibe Coding hat einige große Schritte voran gemacht. Es ist nützlich, aber muss genau überwacht werden. Und man muss sich bewusst sein, dass der Code nicht wirklich "gut" ist, sondern nur funktioniert. Man spart also einiges an Enticklungszeit, muss aber dafür eine menge Zeit in Reviews investieren. Nur ein kleines Problem in dieser Anwendung, aber wenn Kundendaten verarbeitet und gespeichert werden, können schlechte Designentscheidungen zu großen Problemen führen. Es gibt bereits viele vibe-codierte Anwendungen, die von Millionen genutzt werden und einfach wirklich schlecht geschrieben sind und ständig Daten leaken. Nur ein Beispiel von vielen: https://cybernews.com/security/ai-girlfriend-app-leak-exposes-400k-users/

Kein Entwickler möchte für eine Katastrophe wie diese verantwortlich sein, noch bevor man an DSGVO-Strafen denkt.

Außerdem: Noch mehr als bei menschlicher Entwicklung: Verwende Versionskontrolle. Dies hilft beim Zurücksetzen auf einen vorherigen Zustand, wenn die KI nach einem Fehler ein Durcheinander erstellt hat. Aber ich würde vorschlagen, nur ein lokales Repository zu verwenden und manuell zu pushen, um sicherzustellen, dass keine Secrets im Code landen. Überprüfe auch nicht nur den aktuellen Code, sondern jeden Commit, ob es irgendwann ein Secret gab.

Nichtsdestotrotz können wir KI beim Erstellen von Programmen auch nicht einfach ignorieren. Selbst wenn die KI-Blase eines Tages platzt, werden die Tools bleiben. LLMs werden immer noch da sein und einfach ein weiteres Tool in der Cloud oder vielleicht sogar auf lokalen Rechnern sein. Egal, ob jemand mit dem Verkauf von KI-Tools viel Geld verdient oder nicht. KI wird besser werden, aber es wird immer die gleiche Art von Fehlern geben, die man nicht loswerden kann. Halluzinationen sind eine Sache und werden es immer sein.

Ich denke auch, dass die nächste(n) Generation(en) diejenigen sein werden, die am meisten von KI profitieren, aber auch am meisten darunter leiden werden. Profitieren, weil es nie so einfach war anzufangen. Brauchst Du etwas in Deinem Betriebssystem? Frage die KI, ein Python-Skript zu schreiben. Hast Du Probleme mit Dependency Injection? Die KI wird ein Dokument mit guten Beispielen liefern. Du könntest das ohne KI finden, aber das ist einfach einfacher und schneller. Auf der negativen Seite: Dein Problem wird gelöst, aber vielleicht nicht auf die beste Weise. Und das ist nicht nur ein akademisches Argument: Man muss verstehen, warum wir keine Passwörter speichern, sondern stattdessen Hashes verwenden, um das zugrundeliegende Risiko zu verstehen.

Und zusätzlich wird von nun an nicht mehr viel neuer Inhalt erstellt werden. Du bekommst jede Information, die Du brauchst, durch KI. Aber wenn in ein paar Jahren keine neuen Informationen im Internet erstellt werden, wird die KI hauptsächlich Inhalte scrapen, die sie selbst erstellt hat, was zu einer perfekten endlosen Confirmation Bias-Schleife führt.

Und eine persönliche Anmerkung: Einerseits: KI ist ein großartiges Werkzeug, andererseits hat sie fast schon jede Nutzung der Websuche zerstört. Hast Du jemals versucht, Informationen zu finden über "Ist es in Ordnung, wenn mein Hund Zeug frisst"? Die ersten zwei Google-Seiten enthalten hauptsächlich KI-generierte Inhalte. Und diese reichen von "Kein Problem. Zeug ist sogar sehr gesund" bis "Niemals! Ein Bissen und Dein Hund ist tot!". Ich konnte dem eine Weile entkommen, indem ich DuckDuckGo und die "Alle Ergebnisse von dieser Seite blockieren"-Funktion verwendet habe, aber bin an einem Punkt angelangt, wo Seiten mit zufälligen Domains schneller erstellt werden, als ich sie blocken kann.

Vielleicht sollte ich KI verwenden, um diese Listen auf dem neuesten Stand zu halten.... 😀

Next Post Previous Post

Popular Tags

raspberrypi homeautomation sharepoint csharp synology office365 winforms windows mastodon homeassistant nanoleaf bluetooth fiddler proxy grafana fediverse fhem homematic csom git scrum imap php flashair

Syndicate

Atom 1.0 RSS

About me

My name is Ole Albers, I live in the beautiful city of Hamburg, Germany. I am addicted to coding and Franzbrötchen and people sometimes call me a "Full Schnack Developer" (and this is not a typo). Feel free to ask me what this means :)