TERUG NAAR PROJECTEN

PROJECT

LLM SECURITY CLI-TOOL

LLM gestuurde Git-Scan

Projectdetails

Release Datum

31/10/2025

Klanten

JetBrains (Internships), Openbare Uitgave

Development Stack

Kerntechnologieën

README.md

LLM Powered Git-Scan is een experimentele securitygerichte CLI-tool ontwikkeld om Git commit-diffs te analyseren op mogelijk gevoelige data zoals API keys, credentials, databaseverbindingsgegevens en andere secrets die niet in een repository terecht zouden moeten komen.

De tool werd zelfstandig ontwikkeld in Python als onderdeel van een JetBrains internship assignment, waarbij het doel was om te onderzoeken hoe Large Language Models geïntegreerd kunnen worden in een cybersecurity automation workflow. De tool ondersteunt zowel lokale Git-repositories als publieke GitHub-repositories, waarbij remote repositories tijdelijk worden gekloond wanneer dat nodig is voor analyse.

In plaats van een volledige repository te scannen, richt de tool zich specifiek op de diffs van een configureerbaar aantal recente commits. Toegevoegde en verwijderde regels worden opgehaald met commit- en bestandscontext, vervolgens in batches verwerkt en geanalyseerd via de OpenAI API. Mogelijke bevindingen worden weggeschreven naar een gestructureerd JSON-rapport met de commit, het bestand, de gewijzigde regel, het type wijziging, het detectieresultaat, de confidence score en een uitleg.

Het project bevat daarnaast CLI-argumenten, repositoryvalidatie, Python-versiecontroles, automatische packagecontrole/installatie, voortgangsindicatoren, tijdelijke repositoryverwerking en configureerbare outputgeneratie. Deze onderdelen werden toegevoegd om de tool bruikbaarder te maken als zelfstandige command-line utility.

Hoewel het concept tijdens de ontwikkeling technisch haalbaar bleek, liet het project ook een belangrijke beperking zien van generatieve AI binnen deterministische tooling. De tool was afhankelijk van consistente JSON-responses van de LLM, maar veranderingen en variatie in responseformatting veroorzaakten later betrouwbaarheidsproblemen in de parsing-stap. Daarom wordt het project nu voornamelijk gepresenteerd als experimenteel prototype en leerproject in plaats van als productieklare securityscanner.

Gebouwd met Python, GitPython, OpenAI API, dotenv, tqdm, CLI-tooling, Git diff-analyse en JSON-rapportage.