首頁 web前端 js教程 如何偵測瀏覽器中的程式碼語言

如何偵測瀏覽器中的程式碼語言

Nov 27, 2024 am 12:13 AM

How to detect code language in browser

儲存庫:https://github.com/ray-d-song/guesslang-js

示範:https://ray-d-song.github.io/guesslang-js/

最近在做一個叫EchoRSS的項目,有一個非常想要的功能,就是攔截訂閱中的外部連結(閱讀全文、引用等)並直接顯示在當前頁面上。

存在回傳的HTML程式碼區塊遺失語言標註的問題(或原程式碼區塊中的pre和code標籤上沒有標註語言),因此無法使用shiki或prism.js等工具進行高亮顯示。

我找到了三種偵測程式語言的解決方案:

1. 語言學家

這是一個部署在伺服器上的Ruby項目,Github使用它來偵測儲存庫的語言組成。如果你需要極高的精度並且可以在伺服器上計算,這是最好的解決方案。

2. HLJS

highlight.js 是一個非常有名的網頁程式碼高亮函式庫,也是唯一提供自動程式碼偵測的函式庫。

原理很簡單,就是枚舉該語言的關鍵字,然後將它們與文本一一匹配,最後看哪一個匹配度最高。

hljs 有四個問題。

  • 需要非常長的程式碼長度,大多數語言至少需要300個字元才能達到相對較好的準確性。
  • 偵測語言的部分並不是一個單獨的模組,而是與解析器和渲染器緊密耦合,而且程式碼也非常命令式,很難提取出有用的部分。
  • 如果不提取偵測模組,在使用hljs高亮時,程式碼的原始格式(換行和縮排)將會遺失。
  • 需要大量正規匹配,效能較差,且由於原因2,無法在Web Worker中運作。

3. 猜測

guesslang是一個基於tensorflow.js的機器學習專案。

微軟在2021年將此專案移植到node.js,並在vscode中加入了自動語言偵測功能。

三年前有個越南小夥hieplpvip也把這個項目移植到瀏覽器上,但是也存在三個問題:

  • 記憶體洩漏,記憶體洩漏...
  • 僅支援; tag引入umd格式,不支援esm,不支援bundle
  • 同樣,由於原因2,它不支援Web Worker

這傢伙還沒有維護這個項目,三月支持esm的壯舉請求也沒有得到回應。

於是我從hljs中提取了檢測模組,並fork了guesslang-js來修復上述問題,最終guesslang獲勝,結果是這樣的:
https://github.com/ray-d-song/guesslang-js

我覺得說的太多了,也許以後有人需要,所以我就發一下。

如果有人了解tensorflow.js,希望能推薦一些學習資料,我想進一步修改為web gpu計算以提高效率。

以上是如何偵測瀏覽器中的程式碼語言的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1657
14
CakePHP 教程
1415
52
Laravel 教程
1309
25
PHP教程
1257
29
C# 教程
1230
24
神秘的JavaScript:它的作用以及為什麼重要 神秘的JavaScript:它的作用以及為什麼重要 Apr 09, 2025 am 12:07 AM

JavaScript是現代Web開發的基石,它的主要功能包括事件驅動編程、動態內容生成和異步編程。 1)事件驅動編程允許網頁根據用戶操作動態變化。 2)動態內容生成使得頁面內容可以根據條件調整。 3)異步編程確保用戶界面不被阻塞。 JavaScript廣泛應用於網頁交互、單頁面應用和服務器端開發,極大地提升了用戶體驗和跨平台開發的靈活性。

JavaScript的演變:當前的趨勢和未來前景 JavaScript的演變:當前的趨勢和未來前景 Apr 10, 2025 am 09:33 AM

JavaScript的最新趨勢包括TypeScript的崛起、現代框架和庫的流行以及WebAssembly的應用。未來前景涵蓋更強大的類型系統、服務器端JavaScript的發展、人工智能和機器學習的擴展以及物聯網和邊緣計算的潛力。

JavaScript引擎:比較實施 JavaScript引擎:比較實施 Apr 13, 2025 am 12:05 AM

不同JavaScript引擎在解析和執行JavaScript代碼時,效果會有所不同,因為每個引擎的實現原理和優化策略各有差異。 1.詞法分析:將源碼轉換為詞法單元。 2.語法分析:生成抽象語法樹。 3.優化和編譯:通過JIT編譯器生成機器碼。 4.執行:運行機器碼。 V8引擎通過即時編譯和隱藏類優化,SpiderMonkey使用類型推斷系統,導致在相同代碼上的性能表現不同。

JavaScript:探索網絡語言的多功能性 JavaScript:探索網絡語言的多功能性 Apr 11, 2025 am 12:01 AM

JavaScript是現代Web開發的核心語言,因其多樣性和靈活性而廣泛應用。 1)前端開發:通過DOM操作和現代框架(如React、Vue.js、Angular)構建動態網頁和單頁面應用。 2)服務器端開發:Node.js利用非阻塞I/O模型處理高並發和實時應用。 3)移動和桌面應用開發:通過ReactNative和Electron實現跨平台開發,提高開發效率。

Python vs. JavaScript:學習曲線和易用性 Python vs. JavaScript:學習曲線和易用性 Apr 16, 2025 am 12:12 AM

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

如何使用Next.js(前端集成)構建多租戶SaaS應用程序 如何使用Next.js(前端集成)構建多租戶SaaS應用程序 Apr 11, 2025 am 08:22 AM

本文展示了與許可證確保的後端的前端集成,並使用Next.js構建功能性Edtech SaaS應用程序。 前端獲取用戶權限以控制UI的可見性並確保API要求遵守角色庫

從C/C到JavaScript:所有工作方式 從C/C到JavaScript:所有工作方式 Apr 14, 2025 am 12:05 AM

從C/C 轉向JavaScript需要適應動態類型、垃圾回收和異步編程等特點。 1)C/C 是靜態類型語言,需手動管理內存,而JavaScript是動態類型,垃圾回收自動處理。 2)C/C 需編譯成機器碼,JavaScript則為解釋型語言。 3)JavaScript引入閉包、原型鍊和Promise等概念,增強了靈活性和異步編程能力。

使用Next.js(後端集成)構建多租戶SaaS應用程序 使用Next.js(後端集成)構建多租戶SaaS應用程序 Apr 11, 2025 am 08:23 AM

我使用您的日常技術工具構建了功能性的多租戶SaaS應用程序(一個Edtech應用程序),您可以做同樣的事情。 首先,什麼是多租戶SaaS應用程序? 多租戶SaaS應用程序可讓您從唱歌中為多個客戶提供服務

See all articles