HTML5, TAILWIND CSS, PYTHON, FASTAPIVANILLA JAVASCRIPT (FETCH API),OPENAI WHISPER (PYTORCH / NVIDIA CUDA), GOOGLE GEMINI API,YT-DLP, FFMPEG
Auto Notulensi Rapat: Sistem Cerdas Transkripsi dan Rangkuman Rapat Otomatis
Aplikasi berbasis Artificial Intelligence (AI) yang dirancang secara khusus untuk memangkas waktu penyusunan notulensi rapat resmi dan dokumentasi administratif. Sistem ini mengotomatiskan seluruh alur kerja—mulai dari ekstraksi audio (via tautan maupun unggahan lokal), transkripsi akurat (Speech-to-Text) yang diakselerasi menggunakan komputasi GPU secara lokal, hingga pemrosesan bahasa alami (NLP) untuk menyusun dokumen notulensi yang terstruktur. Hasil akhir berupa dokumen Microsoft Word siap pakai yang menyajikan kronologi rapat, identifikasi pembicara, kesimpulan, dan tindak lanjut (action items), lengkap dengan lampiran transkrip mentah sebagai arsip otentik.
Fitur Utama (Key Features):
Multi-Source Audio Ingestion: Mendukung ekstraksi audio otomatis langsung dari tautan video YouTube maupun unggahan berkas media lokal (MP4/MP3/WAV).
Local GPU-Accelerated Transcription: Menggunakan model AI lokal berbasis PyTorch dan arsitektur CUDA (NVIDIA) untuk menghasilkan transkripsi bahasa Indonesia dengan tingkat akurasi tinggi dan latensi rendah.
Intelligent Summarization: Memanfaatkan Large Language Model (LLM) dengan context window masif untuk merangkum dan menyusun transkrip kasar menjadi format tata naskah kedinasan yang rapi dan kronologis.
Automated Document Generation: Mengekspor hasil rangkuman dan transkrip mentah secara otomatis ke dalam format dokumen siap unduh (.docx).
Asynchronous Processing: Arsitektur backend asinkronus yang memastikan server tetap responsif meskipun sedang menangani beban komputasi AI yang berat di latar belakang.
Teknologi yang Digunakan (Tech Stack):
Backend Framework: Python, FastAPI
AI & Machine Learning: OpenAI Whisper (PyTorch / NVIDIA CUDA), Google Gemini API
Media Processing: yt-dlp, FFmpeg
Document Generator: python-docx
Frontend Web: HTML5, Tailwind CSS, Vanilla JavaScript (Fetch API)
Fitur Utama (Key Features):
Multi-Source Audio Ingestion: Mendukung ekstraksi audio otomatis langsung dari tautan video YouTube maupun unggahan berkas media lokal (MP4/MP3/WAV).
Local GPU-Accelerated Transcription: Menggunakan model AI lokal berbasis PyTorch dan arsitektur CUDA (NVIDIA) untuk menghasilkan transkripsi bahasa Indonesia dengan tingkat akurasi tinggi dan latensi rendah.
Intelligent Summarization: Memanfaatkan Large Language Model (LLM) dengan context window masif untuk merangkum dan menyusun transkrip kasar menjadi format tata naskah kedinasan yang rapi dan kronologis.
Automated Document Generation: Mengekspor hasil rangkuman dan transkrip mentah secara otomatis ke dalam format dokumen siap unduh (.docx).
Asynchronous Processing: Arsitektur backend asinkronus yang memastikan server tetap responsif meskipun sedang menangani beban komputasi AI yang berat di latar belakang.
Teknologi yang Digunakan (Tech Stack):
Backend Framework: Python, FastAPI
AI & Machine Learning: OpenAI Whisper (PyTorch / NVIDIA CUDA), Google Gemini API
Media Processing: yt-dlp, FFmpeg
Document Generator: python-docx
Frontend Web: HTML5, Tailwind CSS, Vanilla JavaScript (Fetch API)
Galeri & Tangkapan Layar