Menghubungkan AI dengan SQL & Excel
Kita telah mengetahui Vector Database sangat canggih untuk menganalisis dan menalar sebuah surat regulasi PDF tak beraturan (Unstructured Data). Sayangnya, tulang punggung bisnis di Indonesia tidak berjalan di atas kumpulan paragraf naratif. Mereka berputar murni pada sel baris dan kolom yang teratur membosankan: Spreadsheet Microsoft Excel, file berekstensi .CSV, dan arsitektur SQL.
Masalahnya, vektor diciptakan untuk "membaca kalimat", bukan "menjumlahkan nominal Rupiah bulanan". Jika kamu menaruh seribu baris data pengeluaran Excel di ChromaDB, AI tersebut bakal tersendat konyol jika kamu bertanya "Berapa total profit perusahaan kuartal ini?"
Menyulap AI sebagai Data Analyst (Pandas Agent)
Alih-alih menyuruh AI menalar sendiri ribuan baris tersebut (yang pasti berakhir halusinasi hitungan gila dan keliru batas logik), metodologi modern mengajarkan kita untuk Menyuruh AI menjadi Programmer Python. Konsep ini menggunakan teknologi yang dimotori framework "Langchain" di mana AI diberi _Tool/Agent_.
Begini cara kerja perulangan rahasianya saat User melempar tabel Excel mentah berserta prompt: *"Tolong totalkan pengeluaran staf bulan Juni!"*
- AI tidak membaca angka di sel excel secara verbal.
- AI akan berpikir secara kognitif: *"Ah, saya butuh kode Python (Library Pandas) untuk membaca file `dokumen.xlsx`."*
- Diam-diam AI men-generate kode eksekusi:
df.loc[df['Month'] == 'Juni']['Pengeluaran_Staf'].sum() - Sistem server lokal-mu (Computer Sandbox) MENJALANKAN KODE Python mesin tersebut dan mendapatkan hasil hitungan matematis 100% akurat: *"Rp 54.000.000"*.
- Sistem server mengirim *"54.000.000"* kembali kepada asisten AI.
- AI mempoles angka tersebut ke dalam layar user: "Baik pak, total pengeluaran staf bulan Juni mencapai 54 Juta Rupiah."
"Kita tidak menyuruh AI untuk memutar otak berhitung koma desimal, karena Llama 3 atau GPT-4 itu buta hitungan aritmetika dasar. Kita menyuruh AI membuat kodenya, dan membiarkan kalkulator komputer yang mengerjakannya kembali." - Senior Data Engineer
Menjembatani Skema SQL Base (Relasional)
Bila perusahaanmu terlalu besar untuk menyimpan *CSV Excel* dan sudah melanjut ke infrastruktur peladen terpusat seperti *MySQL* atau *PostgreSQL*, filosofinya masih sama (Menuju rute otomatisasi pembuatan _Query_ ketimbang tebakan).
Skema *LangChain SQL Agent* akan mula-mula mengekstrak Struktur Tabel (hanya membaca nama Tabel dan _Header_ kolom saja, bukan isinya, demi kecepatan). Ketika User bos bertanya, *"Mana dari 10 cabang di Bekasi yang pendapatannya paling tinggi tapi pekerjanya hanya enam?"*
# 1. AI merangkai SQL Query mentah di latar belakang:
SELECT nama_cabang FROM revenue_table
WHERE lokasi='Bekasi' AND jumlah_karyawan=6
ORDER BY pendapatan DESC LIMIT 1;
# 2. Database SQL memberikan nama cabangnya
# 3. AI mengkonversi jawaban menjadi bahasa manusia.
Batasan Keamanan (Keamanan SQL Injection)
Peringatan kelas berat: Memberi mesin AI lokal akses penuh (`Write Access`) ke database operasional *Produksi* milik kantor adalah tindakan konyol paling mematikan. Model terkadang bisa keliru atau mempraktekkan ilusi berhalusinasi menyusun kata kunci *DROP TABLE* atau menghapus semua laporan gaji setahun penuh secara tidak sengaja.
Selalu pastikan *Agent AI Local* milikmu berada di kasta koneksi _"Read-Only"_ saat disambungkan ke skema SQL perusahaan. Jika memungkinkan, putuskan mereka untuk diletakkan di *server backup / replika ganda (Read Replica)* sehingga beban pikiran analitik berjam-jam dari AI ini tidak membuat server inti pembeli pelanggan menjadi macet (Lemot database).
Dengan selesainya Bab ini, AI kini dapat membedah novel raksasa melalui *Vector Semantic (RAG)* sekaligus membantai akuntansi komersial lewat *Data Analyst Agent*. Di Bab 5 kelak, kita menata tahap paripurna pengawas siber ini agar tak diretas!
Ringkasan Bab
- File data baris terstruktur seperti format `.CSV` dan *.Excel* tidak cocok diletakkan dalam *Vector Database*. Memaksakan hitung matematis pada RAG biasa akan menimbulkan tebakan fiktif (kesalahan penjumlahan fatal).
- Solusinya adalah mempekerjakan asisten dengan "Data Analyst Agent", di mana AI tidak membaca data, tapi menciptakan skrip Python pandas untuk menghitung tabel itu secara logis terpisah.
- Untuk integrasi skala besar (SQL Integrasi), batasi otorisasi akses login bot LLM dengan otentikasi ketat "HANYA-BACA" (*Read-Only Proxy*) untuk mencegah tragedi hapus data masif yang dimotori oleh insiden SQL Injeksi artifisial.
Kuis Sub-bab
5 huruf
› Format ekstensi spreadsheet Microsoft yang sering dibaca oleh AI Business Intelligence?