Pemahaman inti dari rekayasa prompt: efisiensi ≠ panjang, akurasi ≠ kompleks. Banyak orang terjebak dalam dua kesalahan saat merancang prompt di tahap awal: pertama, mereka berpikir bahwa semakin banyak kata yang ditulis dalam prompt, semakin baik LLM memahami kebutuhan, sehingga mereka menumpuk banyak instruksi yang berlebihan, yang menyebabkan model tidak dapat menangkap inti, dan malah menurunkan efisiensi terjemahan; kedua, mereka berpikir bahwa semakin kompleks prompt, semakin mencerminkan profesionalisme, sehingga menggunakan ungkapan yang sulit dipahami, yang menyebabkan model salah mengartikan instruksi dan menghasilkan terjemahan yang tidak sesuai harapan. Faktanya, prompt yang efisien dan akurat memiliki inti "menyampaikan kebutuhan secara tepat, menetapkan batasan yang jelas, dan mengarahkan model untuk beraksi", setiap instruksi memiliki tujuan yang jelas, setiap detail memiliki fungsi yang sesuai, tidak berlebihan, dan tidak samar, sehingga LLM dapat dengan cepat menangkap kebutuhan inti dalam ruang konteks yang terbatas dan menyelesaikan tugas terjemahan dengan efisien.

Dalam skenario terjemahan LLM, desain prompt perlu berfokus pada "tiga inti kualitas terjemahan": akurasi, kelancaran, konsistensi. Akurasi adalah dasar dari terjemahan, mengharuskan terjemahan tidak kehilangan, tidak salah terjemah makna inti teks asli, terutama istilah profesional, angka, nama orang, nama tempat, dan informasi kunci lainnya; kelancaran adalah kualitas terjemahan, mengharuskan terjemahan sesuai dengan kebiasaan ekspresi dalam bahasa target, kalimat alami, logika jelas, hindari terjemahan kata-per-kata yang mengakibatkan kaku; konsistensi adalah persyaratan inti dari terjemahan profesional, mengharuskan istilah, gaya kalimat, dan nada tetap konsisten di seluruh teks, menghindari masalah "sama istilah memiliki banyak cara terjemahan" dan "perbedaan nada di depan dan belakang". Semua detail desain prompt harus berfokus pada tiga inti ini, memastikan setiap instruksi dapat mendukung peningkatan kualitas terjemahan.
Satu, detail desain struktur inti prompt (wajib baca)
Prompt yang efisien dan akurat, bukan sekadar tumpukan instruksi yang acak, tetapi memiliki logika struktur yang jelas, memperhatikan "kebutuhan inti" dan "kebutuhan tambahan", sehingga LLM dapat dengan cepat membedakan prioritas dan fokus pada tugas inti. Setelah banyak pengujian, saya merangkum satu set struktur inti prompt yang sesuai untuk skenario terjemahan LLM, terbagi menjadi 4 modul, masing-masing modul memiliki fungsi dan detail desain yang jelas, sangat praktis, sebagai berikut:
1. Modul pengaturan peran (harus ditambahkan di awal, menetapkan nada)

Pengaturan peran adalah dasar dari desain prompt, fungsi intinya adalah untuk membimbing LLM masuk ke dalam skenario terjemahan yang sesuai, menentukan posisi dirinya, meningkatkan profesionalisme terjemahan. Banyak orang mengabaikan modul ini, langsung memberikan instruksi terjemahan, yang mengakibatkan terjemahan yang dihasilkan oleh LLM tidak memiliki kesesuaian dengan skenario—misalnya, menerjemahkan makalah akademis, tetapi menghasilkan terjemahan yang bersifat lisan; menerjemahkan artikel populer, tetapi menghasilkan ekspresi profesional yang terlalu rumit. Detail desain pengaturan peran, kuncinya adalah "spesifik, sesuai dengan skenario", hindari ungkapan yang kabur, poin-poin spesifik adalah sebagai berikut:
① Tentukan identitas profesional: Berdasarkan konteks terjemahan, tetapkan peran profesional spesifik untuk LLM, seperti "Penerjemah dokumen teknologi profesional", "Ahli penerjemah makalah akademis", "Penerjemah naskah populer", "Konsultan penerjemah dokumen hukum", dll., hindari penggunaan istilah yang kabur seperti "asisten penerjemah". Misalnya, untuk menerjemahkan dokumen teknis di bidang AI, pengaturan peran dapat ditulis sebagai "Anda adalah penerjemah dokumen teknologi profesional di bidang AI, dengan pengalaman terjemahan dokumen teknologi AI selama lebih dari 5 tahun, memahami istilah profesional di bidang AI, logika teknis, dan kebiasaan ekspresi, mampu menerjemahkan dokumen teknis bahasa Inggris ke dalam bahasa Indonesia secara akurat dan lancar, memperhatikan profesionalisme dan keterbacaan".
\u003ct-279/\u003e
② Pembatasan kemampuan tambahan: Menggabungkan kebutuhan terjemahan, melengkapi kemampuan inti peran, membimbing LLM untuk bekerja sesuai kebutuhan. Misalnya, saat menerjemahkan dokumen hukum, dapat ditambahkan "menguasai istilah profesional di bidang hukum, memahami norma kalimat dokumen hukum dalam bahasa Inggris dan bahasa Indonesia, mampu menyampaikan makna inti dari teks hukum dengan akurat, patuhi ketelitian teks hukum, tidak menambah, tidak menghapus makna, tidak menggunakan ungkapan yang kabur"; saat menerjemahkan naskah bisnis, dapat ditambahkan "memahami ungkapan umum di bidang bisnis, memiliki daya tarik dalam naskah bisnis, mampu menyampaikan poin jual inti dan nada merek dengan akurat, naskah terjemahan yang dihasilkan ringkas, kuat, mudah disebarkan".
③ Hindari deviasi peran: Dapat menambahkan batasan sederhana untuk menghindari LLM menyimpang dari peran yang ditetapkan. Misalnya, "Jaga identitas sebagai penerjemah profesional sepanjang waktu, tanpa memberikan penjelasan berlebihan, tanpa menambahkan konten yang tidak relevan, hanya menghasilkan hasil terjemahan, patuhi dengan ketat permintaan instruksi selanjutnya".
Panjang modul pengaturan peran tidak boleh terlalu panjang, cukup 1-2 kalimat, inti adalah "penentuan yang akurat, kemampuan yang jelas", untuk menetapkan nada instruksi terjemahan selanjutnya, agar LLM cepat masuk ke dalam mode kerja.
2. Modul kebutuhan inti (inti fokus, penyampaian yang tepat)
Modul kebutuhan inti adalah inti dari prompt, secara langsung menentukan arah dan kualitas terjemahan, perlu jelas "objek terjemahan, bahasa target, batasan inti" dari tiga detail kunci, setiap detail harus tepat, tanpa area yang kabur, agar LLM tidak mengalami kesalahpahaman.
① Penjelasan objek terjemahan yang jelas: Jelaskan dengan jelas jenis dan ruang lingkup konten yang perlu diterjemahkan, untuk menghindari kebingungan dalam batasan terjemahan oleh LLM. Misalnya, "Terjemahkan paragraf teknis bahasa Inggris berikut (total 3 paragraf), mencakup konten terkait pelatihan model AI, termasuk arsitektur model, metode pelatihan, dan hasil eksperimen, tanpa melewatkan satu kalimat pun, tanpa menghilangkan informasi kunci apa pun"; jika yang diterjemahkan adalah file dengan format tertentu (seperti Markdown, tabel), perlu dijelaskan dengan jelas "Terjemahkan dokumen Markdown berikut, pertahankan format Markdown asli (judul, daftar, tabel, dll.), jangan merusak tata letak asli, hanya terjemahkan konten teks, tanpa mengubah label format".
② Penyempurnaan bahasa target: Tidak hanya harus menentukan bahasa target, tetapi juga menggabungkan skenario penggunaan, menentukan versi bahasa, kebiasaan ekspresi, menghindari terjadinya "deviasi adaptasi bahasa". Misalnya, "Terjemahkan ke dalam bahasa Mandarin sederhana, disesuaikan dengan kebiasaan penggunaan di daratan Tiongkok, hindari penggunaan kosakata dari daerah Hong Kong dan Taiwan (seperti '程序' diubah menjadi 'program', '软件' diubah menjadi 'perangkat lunak', '信息' diubah menjadi 'informasi'); struktur kalimat terjemahan disesuaikan dengan kebiasaan ekspresi dalam bahasa Mandarin, hindari munculnya 'bahasa Mandarin khas Inggris'"; jika setelah terjemahan perlu disesuaikan untuk kelompok tertentu, dapat ditambahkan "bahasa target adalah bahasa Mandarin sederhana, bahasa ringkas dan mudah dipahami, disesuaikan untuk pembaca umum, hindari penggunaan kosakata yang terlalu rumit dan teknis, jika perlu tambahkan penjelasan sederhana untuk istilah profesional".
③ Penjelasan batasan inti: Mengelilingi "akurasi, kelancaran, konsistensi", menjelaskan batasan inti, menghindari kesalahan umum sebelumnya. Misalnya, "Harus mempertahankan makna inti dari teks asli, larangan kehilangan terjemahan, salah terjemah, atau menambah terjemahan, terutama untuk angka, nama orang, nama tempat, istilah profesional, dan informasi kunci lainnya, harus akurat; terjemahan harus mengalir dan alami, hindari terjemahan kata-per-kata, sesuaikan urutan kalimat, sesuai dengan logika ekspresi dalam bahasa Mandarin; terjemahan istilah di seluruh teks harus konsisten, jika muncul istilah yang sama beberapa kali, cara terjemahan harus seragam, larangan munculnya cara terjemahan yang berbeda untuk istilah yang sama."
Modul kebutuhan inti adalah "jiwa" dari prompt, setiap instruksi harus tepat dan spesifik, menghindari ungkapan kabur (seperti "terjemahkan lebih akurat", "terjemahan lebih lancar"), harus mengubah kebutuhan yang kabur menjadi instruksi yang dapat dilaksanakan, agar LLM jelas "apa yang harus dilakukan, sampai sejauh mana".
3. Modul kebutuhan tambahan (optimalisasi tambahan, meningkatkan kualitas)
Modul kebutuhan tambahan adalah pelengkap dari kebutuhan inti, fokus utama pada optimalisasi detail terjemahan, meningkatkan kualitas terjemahan, cocok untuk skenario yang memiliki permintaan kualitas terjemahan yang lebih tinggi (seperti makalah akademis, naskah bisnis), dapat ditambahkan secara fleksibel sesuai kebutuhan nyata, tidak berlebihan, tidak menumpuk. Detail desain inti adalah sebagai berikut:
① Pembatasan gaya nada: Berdasarkan konteks terjemahan, tentukan dengan jelas gaya nada terjemahan, untuk menghindari ketidaksesuaian nada. Misalnya, "Terjemahkan dengan nada formal, serius, menggunakan bahasa tulisan akademis, hindari kosakata yang bersifat lisan (seperti 'misalnya' diubah menjadi 'contohnya', 'kira-kira' diubah menjadi 'sekitar', 'sangat' diubah menjadi 'cukup'), kalimat teratur, logika jelas, sesuai dengan kebiasaan ekspresi dalam makalah akademis"; "Terjemahkan dengan nada yang mudah dipahami, ringkas dan lancar, menggunakan gaya populer, hindari penggunaan istilah yang terlalu teknis, jika perlu gunakan bahasa yang umum untuk menjelaskan arti istilah, agar pembaca biasa dapat memahami dengan mudah"; "Terjemahkan dengan nada yang ringkas, kuat, dan memiliki daya tarik, sesuai dengan nada promosi bisnis, menyoroti poin jual inti, bahasa ringkas dan mudah diingat, cocok untuk disebarluaskan".
② Pembatasan optimalisasi kalimat: Menangani masalah "terjemahan kata-per-kata, kalimat yang kaku" yang sering muncul pada LLM, tambahkan instruksi optimalisasi kalimat. Misalnya, "Hindari terjemahan kata-per-kata, sesuaikan urutan kalimat berdasarkan kebiasaan ekspresi dalam bahasa Indonesia, bagi kalimat panjang yang sulit dalam bahasa Inggris menjadi kalimat pendek dalam bahasa Indonesia, pastikan terjemahan mengalir secara alami, logika jelas; pertahankan hubungan logis dari teks asli (sebab-akibat, peralihan, peningkatan, dll.), sambungkan dengan kata penghubung yang umum dalam bahasa Indonesia (karena, jadi, tetapi, selain itu, dll.), untuk meningkatkan koherensi terjemahan".
③ Pembatasan pada format: Jika konten terjemahan mengandung format tertentu (seperti tabel, daftar, blok kode, kutipan), perlu jelas tentang persyaratan pemeliharaan format. Misalnya, "Pertahankan struktur tabel asli, terjemahkan konten teks dalam tabel, tidak mengubah jumlah baris, jumlah kolom, tidak merusak format tabel; konten daftar setelah terjemahan, pertahankan tingkat daftar yang ada, tidak mengubah urutan daftar; blok kode tidak diterjemahkan, langsung pertahankan teks asli, memastikan integritas dan kebenaran kode".
Inti dari modul kebutuhan tambahan adalah "optimalisasi tambahan", tidak perlu mencakup semuanya, pilih titik optimalisasi kunci sesuai kebutuhan konteks terjemahan, hindari menambahkan instruksi tambahan yang tidak relevan, yang dapat membuang Token dan mengganggu penilaian LLM.
4. Modul hindari kesalahan (prediksi sebelumnya, mengurangi pekerjaan ulang)
Dalam proses terjemahan LLM, seringkali muncul beberapa kesalahan umum (seperti kesalahan terjemahan istilah, deviasi makna, terjemahan kata-per-kata, dan kehilangan terjemahan), fungsi inti dari modul hindari kesalahan adalah untuk memprediksi kesalahan ini sebelumnya, dengan instruksi yang jelas, membimbing LLM untuk menghindari kesalahan, mengurangi pekerjaan ulang selanjutnya. Detail desain adalah sebagai berikut, dapat disesuaikan secara fleksibel sesuai dengan kompleksitas skenario terjemahan:
① Hindari terkait istilah: "Larangan mengubah cara terjemahan istilah profesional secara sembarangan, terjemahkan sesuai dengan daftar istilah yang akan diberikan; jika menemui istilah profesional yang tidak ada dalam daftar, perlu mempertimbangkan konteks, memilih cara terjemahan yang sesuai dengan makna teks asli dan sesuai dengan ungkapan umum di bidang terkait, hindari kesalahan terjemahan istilah".
② Hindari terkait makna: "Larangan penerjemahan yang hilang, salah terjemah, atau menambah makna dari konten asli, tidak menambahkan makna yang tidak ada dalam teks asli, tidak menghapus informasi inti dari teks asli; saat menghadapi kata yang memiliki banyak arti, perlu mempertimbangkan konteks untuk menentukan makna spesifik, pilih cara terjemahan yang paling sesuai dengan teks asli, untuk menghindari deviasi makna".
③ Hindari terkait kalimat: "Larangan terjemahan kata-per-kata, hindari munculnya 'bahasa Inggris khas Tiongkok' dan 'bahasa Mandarin khas Inggris'; larangan penggunaan kalimat yang terlalu rumit dan kaku, pastikan terjemahan mengalir secara alami, sesuai dengan kebiasaan ekspresi dalam bahasa target".
④ Hindari terkait detail: "Angka, nama orang, nama tempat, tanggal, dan informasi kunci lainnya, harus diterjemahkan dengan akurat, tidak mengubah dan tidak melewatkan; penggunaan tanda baca harus sesuai dan mengacu pada kebiasaan penggunaan tanda baca dalam bahasa Mandarin, hindari penggunaan tanda baca dalam bahasa Inggris".
Instruksi modul hindari kesalahan harus spesifik dan terfokus, menghindari ungkapan kabur, agar LLM dapat dengan jelas memahami jenis kesalahan yang harus dihindari, mempersiapkan diri sebelumnya untuk meningkatkan akurasi terjemahan.
Keempat modul di atas membentuk struktur inti dari prompt di bawah skenario terjemahan LLM, dengan logika keseluruhan yang jelas dan prioritas yang jelas: pengaturan peran menetapkan nada, kebutuhan inti menentukan arah, kebutuhan tambahan meningkatkan kualitas, dan penghindaran kesalahan mengurangi pekerjaan ulang. Dalam desain praktis, dapat disesuaikan dengan kompleksitas skenario terjemahan, intinya adalah "tepat, efisien, tanpa redundansi".