@Fabric Foundation Pe lângă structura de bază, designul prompturilor are multe detalii care afectează direct rezultatele LLM-ului, aceste detalii fiind adesea ușor de trecut cu vederea de către începători, dar esențiale pentru îmbunătățirea calității traducerii. Având în vedere doi ani de experiență practică, am organizat următoarele 6 detalii esențiale, fiecare având metode și exemple specifice de design, care pot fi utilizate direct.
1. Detalii despre integrarea glosarului (nucleul coerenței)
Coerența terminologică este cerința principală a traducerii profesionale și este, de asemenea, cea mai predispusă la probleme în traducerea LLM - în special în domenii specializate (AI, tehnologie, medicină, drept), diferitele traduceri ale aceleași terminologii pot afecta grav profesionalismul și lizibilitatea traducerii. Detaliile esențiale privind integrarea glosarului în prompturi nu constau în „enumerarea termenilor”, ci în „clarificarea constrângerilor, facilitând recunoașterea de către model”, detaliile specifice sunt următoarele:
① Formatul glosarului este clar: glosarul trebuie plasat după modulul de cerințe de bază ale cuvintelor cheie, folosind formatul „termen original=metoda de traducere în limba țintă”, clar și ușor de recunoscut pentru LLM. De exemplu, „Glosar de termeni esențiali: 1. Prompt Engineering=inginerie de cuvinte cheie; 2. Large Language Model=mare model lingvistic (prescurtat LLM); 3. Hallucination=iluzie; 4. Agent=agent inteligent; 5. Moat=șanț; 6. AI Wrapper=încadrare AI; 7. Fine-tuning=ajustare fină; 8. Context Window=feron context.”
② Constrângerea terminologică este clară: la sfârșitul glosarului, se adaugă instrucțiuni clare de constrângere, pentru a asigura LLM că traduce strict conform glosarului, evitând modificările neautorizate. De exemplu, „toți termenii trebuie tradusi strict conform glosarului de mai sus, interzicerea modificărilor neautorizate ale traducerii; dacă același termen apare de mai multe ori în textul original, traducerea trebuie să fie complet consistentă; dacă întâlniți termeni care nu sunt incluși în glosar, trebuie să alegeți cea mai precisă metodă de traducere, conform contextului și expresiilor comune din domeniu, pentru a asigura consistența termenilor.”
③ Prioritatea terminologiei este clară: dacă în textul original apare o formă prescurtată a terminologiei, aceasta trebuie să fie clarificată în glosar, evitând confuzia LLM. De exemplu, „Notă suplimentară: LLM este prescurtarea pentru Large Language Model, la traducere se va folosi prioritar ‘mare model lingvistic’, la prima apariție poate fi marcată prescurtarea (mare model lingvistic, LLM), iar ulterior se folosește direct ‘mare model lingvistic’.”
④ Optimizarea și simplificarea glosarului: glosarul nu trebuie să conțină toate termenii comuni, ci doar termenii „ușor de tradus greșit, controversați, specifici domeniului”, evitând redundanța. De exemplu, în domeniul AI, „Machine Learning=învățare automată” este un termen care se traduce corect chiar de model, deci nu trebuie inclus în glosar; în schimb, „Hallucination=iluzie” (ușor de tradus greșit ca „iluzie”), „Moat=șanț” (ușor de tradus greșit ca „barieră de concurență”) sunt termeni care trebuie să fie incluși în glosar, cu accent pe restricții.
Exemplu: când traduceți documentația tehnică AI, fragmentul complet al instrucțiunilor încorporate în glosar: „Glosar de termeni esențiali: 1. Prompt Engineering=inginerie de cuvinte cheie; 2. Hallucination=iluzie; 3. Agent=agent inteligent; 4. Context Window=feron context; 5. Fine-tuning=ajustare fină. Toți termenii trebuie tradusi strict conform acestui glosar, interzicerea modificărilor neautorizate ale traducerii, același termen care apare de mai multe ori trebuie să mențină o traducere consistentă; LLM este prescurtarea pentru Large Language Model, tradus ca ‘mare model lingvistic’, la prima apariție marcată prescurtarea (mare model lingvistic, LLM), ulterior se folosește direct denumirea completă.”
2. Detaliile de proiectare a constrângerilor de context (nucleul acurateței)
LLM, atunci când procesează traducerea textelor lungi, este predispus la probleme de „discontinuitate în context” - termenii anteriori, stilul frazelor nu sunt consistente cu cele ulterioare sau ignoră logica contextuală a textului original, ducând la devieri semantice în traducere. Prin urmare, cuvintele cheie trebuie să includă constrângeri de context, ghidând LLM să se concentreze pe logica întregului text, menținând coerența și acuratețea traducerii, detaliile specifice sunt următoarele:
① Cerințele de asociere a contextului sunt clare: adăugați instrucțiuni pentru a ghida LLM să traducă în conformitate cu contextul întregului text, evitând traducerea izolată a unei propoziții. De exemplu, „la traducere trebuie să se țină cont de contextul întregului text, înțelegând semantica și relațiile logice (cauză, turnură, progresie, enumerare etc.) ale textului original, evitând traducerea izolată a unei propoziții; asigurați-vă că traducerea este coerentă în întregime, termenii și stilul frazelor rămân consistente, fără a exista discontinuități în context.”
② Constrângerile de context pentru traducerea textelor lungi în bucăți: dacă conținutul tradus este lung (peste fereastra de context a LLM), este necesară traducerea în bucăți, în acest caz trebuie să adăugați instrucțiuni de legătură de context, asigurându-vă că există coerență între diferitele bucăți. De exemplu, „acest conținut de traducere este împărțit în 5 bucăți, la traducerea fiecărei bucăți, trebuie să țineți cont de traducerea anterioară și contextul original, asigurându-vă că termenii și stilul frazelor rămân consistenți; după ce toate bucățile sunt traduse, trebuie să verificați în ansamblu, ajustând părțile de legătură pentru a asigura coerența întregului text și claritatea logicii.”
③ Tratarea contextului pentru fraze ambigue: când LLM se confruntă cu propoziții ambigue, este ușor să apară traduceri greșite, așa că trebuie să adăugăm instrucțiuni pentru a ajuta LLM să evalueze semantica în context. De exemplu, „când întâlniți cuvinte cu mai multe sensuri sau fraze ambigue, trebuie să evaluați cu atenție semnificația specifică în context, alegând metoda de traducere care se potrivește cel mai bine semanticei textului original, evitând devierile semantice cauzate de traducerea izolată; dacă nu se poate determina semnificația, trebuie să păstrați prioritar semantica originală, fără a face presupuneri neautorizate.”
Exemplu: când traduceți texte lungi, fragmentul de cuvinte cheie pentru constrângerile de context: „acest conținut tradus este un fragment dintr-un articol tehnic AI (4 paragrafe în total), la traducere trebuie să țineți cont de contextul întregului text, înțelegând logica de bază a lucrării și punctele tehnice; fiecare traducere a paragrafului trebuie să fie coerentă cu paragrafele anterioare și ulterioare, metodele de traducere a termenilor trebuie să rămână consistente, stilul frazelor trebuie să fie uniform; în cazul întâlnirii unei fraze ambigue sau a unui cuvânt cu mai multe sensuri, trebuie să evaluați semnificația specifică în context, asigurându-vă că semantica traducerii este precisă, fără a exista discontinuități în context sau devieri semantice; după ce traducerea pe paragrafe este completă, trebuie să verificați cu atenție părțile de legătură, optimizând frazele pentru a îmbunătăți coerența textului.”
3. Detaliile de proiectare a priorității instrucțiunilor (nucleul eficienței)
Prioritatea instrucțiunilor cuvintelor cheie influențează direct alocarea atenției LLM - dacă instrucțiunile nu au prioritate, LLM ar putea ignora cerința principală, concentrându-se pe instrucțiunile secundare, ceea ce duce la o scădere a calității traducerii. Prin urmare, la proiectarea cuvintelor cheie, trebuie să clarificăm prioritățile instrucțiunilor, astfel încât LLM să se concentreze mai întâi pe cerințele esențiale, apoi pe cerințele auxiliare, detaliile specifice sunt următoarele:
① Marcarea clară a priorității: instrucțiunile cuvintele cheie sunt împărțite în „instrucțiuni esențiale” și „instrucțiuni auxiliare”, distinse prin marcaje clare (cum ar fi „instrucțiuni esențiale” „instrucțiuni auxiliare”), instrucțiunile esențiale fiind plasate la început, iar cele auxiliare la sfârșit, ghidând LLM să acorde prioritate instrucțiunilor esențiale. De exemplu, „instrucțiuni esențiale: 1. traduceți cu acuratețe, fără a omite sau traduce greșit semantica esențială a textului original, strict conform glosarului; 2. limba țintă este chineză simplificată, adaptată obiceiurilor din China continentală; 3. păstrați formatul Markdown din textul original. Instrucțiuni auxiliare: 1. ton formal, riguros, utilizând limbaj scris; 2. optimizarea frazei, evitând traducerea cuvânt cu cuvânt; 3. semnele de punctuație să corespundă obiceiurilor de utilizare în chineză.”
② Simplificarea instrucțiunilor esențiale: instrucțiunile esențiale nu trebuie să fie prea multe, concentrându-se pe cele trei esențiale „acuratețe, consistență, limba țintă”, limitându-se la 3-4, pentru a evita ca LLM să nu prindă esența. Instrucțiunile auxiliare pot fi adăugate flexibil în funcție de necesitate, dar nu trebuie să fie prea multe, pentru a evita redundanța.
③ Accentuează instrucțiunile cheie: pentru instrucțiunile esențiale foarte importante (cum ar fi consistența terminologiei, acuratețea semnificației), se poate folosi o metodă de accentuare (cum ar fi îngroșarea), pentru a ghida LLM să acorde atenție. De exemplu, „instrucțiuni esențiale: 1. traduceți cu exactitate, păstrând strict semantica esențială a textului original, interzicerea omisiunii, traducerii greșite sau adăugării, în special pentru informațiile cheie precum numere, nume de persoane, termeni tehnici etc.; 2. traducerea terminologică trebuie să fie complet consistentă, strict conform glosarului, interzicerea modificărilor neautorizate; 3. limba țintă este chineză simplificată, adaptată obiceiurilor din China continentală.”
Atenție: accentuarea nu trebuie să fie excesivă, folosită doar pentru cele mai importante instrucțiuni, altfel va pierde efectul de accentuare și va interfera cu judecata LLM.
4. Detaliile de proiectare a ghidării prin exemple (adaptarea la scenarii complexe)
Pentru unele cerințe de traducere complexe (cum ar fi traducerea prin metaforă, optimizarea frazei, adaptarea expresiilor profesionale), instrucțiunile pur textuale sunt adesea insuficiente pentru a permite LLM să înțeleagă. În acest caz, adăugarea de exemple de ghidare, care să ajute LLM să se refere la exemple în timpul traducerii, poate îmbunătăți semnificativ calitatea traducerii și reduce neînțelegerile. Detaliile de proiectare a ghidării prin exemple sunt că „exemplele să fie conforme cu cerințele, concise și clare”, detaliile specifice sunt următoarele:
① Exemplele să fie foarte potrivite pentru cerințele actuale: exemplele trebuie să se potrivească cu scena actuală de traducere, stilul tonal și cerințele esențiale, evitând disconcordanța între exemple și cerințe. De exemplu, atunci când traduceți propoziții metaforice, exemplele trebuie să fie alese din propoziții cu tipuri de metafore similare cu cele din textul original, pentru a ghida LLM în stăpânirea tehnicilor de traducere prin metaforă; când traduceți lucrări academice, exemplele trebuie să utilizeze limbaj academic scris, corespunzând normelor de formulare a lucrărilor academice.
② Exemple concise și ușor de înțeles: exemplele nu trebuie să fie prea lungi, 1-2 fiind suficiente, prezentând în principal „metoda corectă de traducere”, în același timp oferind o scurtă explicație a gândirii de optimizare a exemplului, pentru a ajuta LLM să înțeleagă logica din spatele acestuia. De exemplu, „exemplu: textul original ‘Elvețienii au urmărit japonezii în oglinda retrovizoare pe tot parcursul anilor 1960’, nu se traduce direct ‘din oglinda retrovizoare’, ci se interpretează ca ‘pe tot parcursul anilor 1960, elvețienii au văzut japonezii ca pe niște urmăritori’, conform obiceiurilor de exprimare în chineză, păstrând sensul metaforic al textului original; vă rugăm să traduceți următoarele propoziții metaforice conform acestui exemplu, evitând traducerea directă a sensului literal, interpretând intenția originală înainte de a traduce.”
③ Exemplu și instrucțiuni corespunzătoare: exemplul trebuie să corespundă instrucțiunilor de bază din cuvintele cheie (cum ar fi optimizarea frazei, traducerea prin metaforă), întărind înțelegerea instrucțiunilor de către LLM. De exemplu, dacă cuvintele cheie cer „evitarea traducerii cuvânt cu cuvânt, optimizarea frazei”, exemplul ar trebui să arate „dezavantajele traducerii cuvânt cu cuvânt” și „traducerea optimizată”, pentru a clarifica direcția de optimizare a LLM.
Exemplu: când traduceți frazele metaforice din articolele de popularizare științifică, fragmentul de cuvinte cheie pentru ghidare prin exemple: „instrucțiuni esențiale: evitați traducerea directă a frazelor metaforice, interpretați intenția metaforică a textului original, efectuați o traducere liberă conform obiceiurilor de exprimare în chineză, păstrând semnificația esențială și emoția textului original. Exemplu 1: textul original ‘AI este o sabie cu două tăișuri’, nu se traduce direct ‘AI este o sabie cu două tăișuri’, ci se interpretează ca ‘inteligența artificială este o sabie cu două tăișuri, având atât avantaje, cât și riscuri potențiale’, păstrând sensul metaforic și fiind ușor de înțeles de către cititorii obișnuiți; Exemplu 2: textul original ‘El a spart gheața în negociere’, nu se traduce direct ‘el a spart gheața în negociere’, ci se interpretează ca ‘el a depășit impasul în negociere’, conform obiceiurilor de exprimare în chineză. Vă rugăm să traduceți următoarele propoziții metaforice conform exemplului de mai sus, asigurându-vă că traducerea liberă este precisă, fluidă și ușor de înțeles.”
5. Detaliile de proiectare a optimizării Token (complement la eficiență)
Fereastra de context a LLM este limitată, iar ocuparea excesivă a Token-urilor de cuvinte cheie va reduce conținutul original care poate fi tradus, de asemenea, poate afecta rezultatele de ieșire ale LLM. Prin urmare, în timpul proiectării cuvintelor cheie, trebuie să ne concentrăm pe optimizarea Token-ului, asigurându-ne că instrucțiunile sunt precise, reducând redundanța și economisind Token-uri, detaliile specifice sunt următoarele:
① Eliminarea instrucțiunilor redundante: ștergerea instrucțiunilor repetate sau irelevante, evitând acumularea de instrucțiuni. De exemplu, „traducerea trebuie să fie precisă” și „interzicerea omisiunii sau traducerii greșite”, sunt în esență aceeași cerință, deci trebuie păstrată doar una dintre ele; „traducerea trebuie să fie fluentă” și „evitarea traducerii cuvânt cu cuvânt” pot fi combinate într-o propoziție „traducerea trebuie să fie fluentă și naturală, evitând traducerea cuvânt cu cuvânt, conform obiceiurilor de exprimare în chineză.”
② Simplificarea exprimării, păstrând esența: simplificarea instrucțiunilor complexe, păstrând semnificația esențială, evitând formulări obscure și lungi. De exemplu, „la traducere trebuie să respectăm strict semantica esențială a textului original, fără a adăuga conținut care nu există în original, fără a omite informații cheie din original, asigurând acuratețea și integritatea traducerii”, se simplifică în „păstrarea strictă a semanticei esențiale a textului original, interzicerea adăugării sau omiterii, asigurând acuratețea și integritatea traducerii.”
③ Simplificarea glosarului: așa cum s-a menționat anterior, glosarul trebuie să conțină doar termenii care sunt ușor de tradus greșit sau controversați, eliminând termenii comuni care se pot traduce corect de model, reducând ocuparea Token.
