基于 ChatGPT API 的劃詞翻譯瀏覽器腳本實(shí)現(xiàn)

作者：狂奔滴小馬 2023-04-13 08:37:58

本文介紹了如何實(shí)現(xiàn)劃詞翻譯的基本功能，包括使用 OpenAI 提供的接口進(jìn)行翻譯、在 HTML 頁面中添加觸發(fā)翻譯的按鈕和鼠標(biāo)抬起事件監(jiān)聽事件、使用 AJAX 請(qǐng)求從接口獲取翻譯結(jié)果并將其顯示在 DIV 元素中等。

前言

最近 GitHub 上有個(gè)基于 ChatGPT API 的瀏覽器腳本，openai-translator，短時(shí)間內(nèi) star 沖到了 12k，功能上除了支持翻譯外，還支持潤色和總結(jié)功能，除了瀏覽器插件外，還使用了 tauri 打包了一個(gè)桌面客戶端，那拋開 tauri 是使用 rust 部分，那瀏覽器部分實(shí)現(xiàn)還是比較簡(jiǎn)單的，今天我們就來手動(dòng)實(shí)現(xiàn)一下。

openAI 提供的接口

比如我們可以復(fù)制以下代碼，在瀏覽器控制臺(tái)中發(fā)起請(qǐng)求，就可以完成翻譯

//示例
const OPENAI_API_KEY = "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";

const prompt = `Translate this into Chinese:
        hello world`;
const res = await fetch("https://api.openai.com/v1/completions", {
  method: "POST",
  headers: {
    "Content-Type": "application/json",
    authorization: `Bearer ${OPENAI_API_KEY}`,
  },
  body: JSON.stringify({
    model: "text-davinci-003",
    prompt,
    max_tokens: 1000,
    temperature: 0,
  }),
});
const response = await res.json();

const result = response.choices[0].text;

上述代碼中 OPONAI_API_KEY 需要替換成你自己的。

實(shí)現(xiàn)劃詞翻譯

劃詞翻譯是一種常見的網(wǎng)頁功能，用戶選擇一個(gè)單詞或一段文本時(shí)，自動(dòng)彈出一個(gè)小窗口，顯示該單詞或文本的翻譯。

首先，在 HTML 頁面中添加一個(gè)空的 DIV 元素和一個(gè)觸發(fā)翻譯的按鈕

let keyword;
const translation = document.createElement("div"); 
translation.id ="translation"; 
const icon = document.createElement("img"); 
icon.style.width ="30px";
icon.style.height = "30px";
icon.src ="http://example.com/icon.png";
translation.appendChild(icon)

為頁面添加一個(gè)鼠標(biāo)抬起事件監(jiān)聽器，當(dāng)用戶選擇一段文本時(shí)，設(shè)置搜索關(guān)鍵詞。

document.addEventListener("mouseup", (event) => {
  const selection = window.getSelection().toString().trim();
  if (selection) {
    keyword=selection；
  }
});

鼠標(biāo)點(diǎn)擊執(zhí)行翻譯邏輯。可以使用 AJAX 請(qǐng)求從后臺(tái)獲取翻譯結(jié)果并將其顯示在 DIV 元素中。

function translate(){
  if(keyword){
    // 執(zhí)行翻譯邏輯
  }
}
icon.addEventListener("mouseover", translate);

在 CSS 樣式表中為 DIV 元素添加樣式，使其浮動(dòng)在頁面上顯示。

#translation {
  position: fixed;
  top: 10px;
  right: 10px;
  max-width: 300px;
  padding: 5px;
  background-color: #f7f7f7;
  border: 1px solid #ccc;
  box-shadow: 0px 2px 5px rgba(0, 0, 0, 0.1);
  z-index: 9999;
}

以上這些步驟就能實(shí)現(xiàn)劃詞翻譯的基本功能，一起來看下效果。

react + antd 實(shí)現(xiàn)

上面的代碼只是實(shí)現(xiàn)了一個(gè)最簡(jiǎn)單的版本，樣式也不夠美觀，因此我們可以使用 webpack + react + antd 來實(shí)現(xiàn)一個(gè)現(xiàn)代化的插件，這里我使用一個(gè)之前創(chuàng)建的模版tampermonkey-starter。

使用 antd 的 Popover 組件來顯示，使用 react 重構(gòu)下js代碼，我們就可以實(shí)現(xiàn)如下效果。

劃詞翻譯

點(diǎn)擊翻譯按鈕，就會(huì)通過接口請(qǐng)求，將翻譯結(jié)果顯示在下方。但是翻譯結(jié)果需要等 api 完全返回，才會(huì)顯示出來，這樣會(huì)等待較慢，我們可以使用 Stream，OpenAI 的接口支持流渲染嗎，這樣結(jié)果就會(huì)一個(gè)字一個(gè)字蹦出來。

import { createParser } from "eventsource-parser";

const translate = async (text: string) => {
    const resp = await fetch("https://api.openai.com/v1/completions", {
      method: "POST",
      headers: {
        "Content-Type": "application/json",
        authorization:
          `Bearer ${OPENAI_API_KEY}`,
      },
      body: JSON.stringify({
        model: "text-davinci-003",
        prompt: `Translate this into Chinese:
          ${text}`,
        max_tokens: 1000,
        temperature: 0,
        frequency_penalty: 0,
        stream: true,
      }),
    });
    if (resp.status !== 200) {
      const res = await resp.json();
      setLoading(false);
      console.error(res);
      return;
    }
    const parser = createParser((event) => {
      if (event.type === "event") {
        const data = event.data;
        if (data === "[DONE]") {
          setLoading(false);
        }
        try {
          let json = JSON.parse(event.data);
          setResult((prev) => {
            return prev + json.choices[0].text;
          });
        } catch (error) {
          console.log(error);
        }
      }
    });
    const data = resp.body;
    if (!data) {
      console.log("Error: No data received from API");
      return;
    }
    const reader = resp.body.getReader();
    try {
      while (true) {
        const { done, value } = await reader.read();
        if (done) {
          setLoading(false);
          break;
        }
        const str = new TextDecoder().decode(value);
        parser.feed(str);
      }
    } finally {
      reader.releaseLock();
    }
  };

在上面代碼中，我們使用 fetch? API 發(fā)送了一個(gè) HTTP 請(qǐng)求，并在響應(yīng)中獲取了一個(gè)可讀流。我們可以使用 getReader? 方法獲取一個(gè)讀取器對(duì)象，并使用它來處理流數(shù)據(jù)，使用了 eventsource-parser這個(gè)包來解析服務(wù)器推送（Server-sent events）的數(shù)據(jù)。

這樣響應(yīng)的內(nèi)容就會(huì)根據(jù)Server-sent events（服務(wù)器發(fā)送的事件）逐個(gè)顯示了。

文本轉(zhuǎn)語音

一般翻譯插件都有語音播放的功能，我們可以利用可以使用Web Speech API。此API提供了兩個(gè)語音合成接口：SpeechSynthesis和SpeechSynthesisUtterance

function speak(text) {
  if ('speechSynthesis' in window) {
    const utterance = new SpeechSynthesisUtterance(text);
    utterance.voice = speechSynthesis.getVoices()[0];
    utterance.pitch = 1;
    utterance.rate = 1;
    speechSynthesis.speak(utterance);
  }
}

然后直接調(diào)用這個(gè)函數(shù)，傳入需要朗讀的文本，就可以實(shí)現(xiàn)語音播放

speak('Hello, world!');

小結(jié)

本文介紹了如何實(shí)現(xiàn)劃詞翻譯的基本功能，包括使用 OpenAI 提供的接口進(jìn)行翻譯、在 HTML 頁面中添加觸發(fā)翻譯的按鈕和鼠標(biāo)抬起事件監(jiān)聽事件、使用 AJAX 請(qǐng)求從接口獲取翻譯結(jié)果并將其顯示在 DIV 元素中等。同時(shí)還介紹了如何使用 webpack + react + antd 實(shí)現(xiàn)一個(gè)現(xiàn)代化的插件，并利用 Web Speech API 實(shí)現(xiàn)語音播放功能。

責(zé)任編輯：武曉燕來源： JS酷

偷偷摘套内射激情视频,久久精品99国产国产精,中文字幕无线乱码人妻,中文在线中文a,性爽19p