Projekt demonstracyjny AI
Speech Training — aplikacja do nauki angielskiego z głosem, RAG i LLM
Speech Training to techniczny prototyp aplikacji webowej wspierającej naukę języka angielskiego poprzez ćwiczenia głosowe, automatyczne generowanie materiałów oraz pracę z własnymi dokumentami PDF. Projekt pokazuje praktyczne połączenie klasycznej aplikacji Django/Vue z mechanizmami AI, takimi jak embeddings, baza wektorowa, Retrieval-Augmented Generation oraz integracja z modelami LLM.
Główna idea
Aplikacja umożliwia tworzenie i ćwiczenie słów, fraz, idiomów oraz zdań w języku angielskim. Użytkownik wybiera ćwiczenie, wypowiada tekst na głos, a system rozpoznaje wypowiedź i oblicza prosty scoring podobieństwa. Celem projektu jest zademonstrowanie pełnego przepływu: od materiałów źródłowych, przez generowanie ćwiczeń AI, aż po interaktywny trening speakingu.
Zrzut ekranu aplikacji
Interfejs użytkownika
Frontend został przygotowany w Vue i obsługuje listę ćwiczeń, widok powtarzania zdań, nagrywanie wypowiedzi, odtwarzanie audio oraz prezentację wyniku scoringu.
Backend
Backend oparty jest o Django i Django REST Framework. Odpowiada za modele danych, panel administracyjny, przetwarzanie dokumentów, generowanie ćwiczeń i komunikację z providerami LLM.
RAG i dokumenty PDF
System pozwala wgrywać pliki PDF ze słownictwem lub materiałami edukacyjnymi. Dokumenty są przetwarzane, dzielone na chunki, wzbogacane metadanymi i indeksowane jako embeddings.
Generowanie ćwiczeń
Ćwiczenia mogą być generowane z wybranych chunków dokumentu lub bezpośrednio z prompta użytkownika. LLM tworzy zestawy słów, fraz, idiomów i zdań zgodnie z poziomem, kategorią oraz dodatkowymi instrukcjami.
Przepływ danych
Projekt łączy klasyczne zarządzanie treścią z warstwą AI. Materiały źródłowe są najpierw przetwarzane i indeksowane, a następnie wykorzystywane jako kontekst dla modeli językowych, które generują gotowe ćwiczenia do treningu wymowy.
Upload PDF
Chunking
Embeddings
LLM / RAG
Ćwiczenia głosowe
Najważniejsze technologie
- Python
- Django
- Django REST Framework
- Vue.js
- JavaScript
- Web Speech API
- RAG
- Embeddings
- Vector Database
- OpenAI API
- Ollama
- PDF Processing
- LLM Providers
Charakter projektu
Speech Training powstał jako aplikacja demonstracyjna dla jednego użytkownika, której celem jest pokazanie praktycznego zastosowania głosu, modeli językowych i mechanizmów RAG w edukacji językowej. Projekt może być dalej rozwijany w kierunku pełniejszego systemu do nauki angielskiego, obejmującego personalizację lekcji, historię postępów, bardziej zaawansowany pronunciation scoring oraz integrację z dodatkowymi modelami AI.