如何偵測瀏覽器中的程式碼語言
儲存庫:https://github.com/ray-d-song/guesslang-js
示範:https://ray-d-song.github.io/guesslang-js/
最近在做一個叫EchoRSS的項目,有一個非常想要的功能,就是攔截訂閱中的外部連結(閱讀全文、引用等)並直接顯示在當前頁面上。
存在回傳的HTML程式碼區塊遺失語言標註的問題(或原程式碼區塊中的pre和code標籤上沒有標註語言),因此無法使用shiki或prism.js等工具進行高亮顯示。
我找到了三種偵測程式語言的解決方案:
1. 語言學家
這是一個部署在伺服器上的Ruby項目,Github使用它來偵測儲存庫的語言組成。如果你需要極高的精度並且可以在伺服器上計算,這是最好的解決方案。
2. HLJS
highlight.js 是一個非常有名的網頁程式碼高亮函式庫,也是唯一提供自動程式碼偵測的函式庫。
原理很簡單,就是枚舉該語言的關鍵字,然後將它們與文本一一匹配,最後看哪一個匹配度最高。
hljs 有四個問題。
- 需要非常長的程式碼長度,大多數語言至少需要300個字元才能達到相對較好的準確性。
- 偵測語言的部分並不是一個單獨的模組,而是與解析器和渲染器緊密耦合,而且程式碼也非常命令式,很難提取出有用的部分。
- 如果不提取偵測模組,在使用hljs高亮時,程式碼的原始格式(換行和縮排)將會遺失。
- 需要大量正規匹配,效能較差,且由於原因2,無法在Web Worker中運作。
3. 猜測
guesslang是一個基於tensorflow.js的機器學習專案。
微軟在2021年將此專案移植到node.js,並在vscode中加入了自動語言偵測功能。
三年前有個越南小夥hieplpvip也把這個項目移植到瀏覽器上,但是也存在三個問題:
- 記憶體洩漏,記憶體洩漏...
- 僅支援; tag引入umd格式,不支援esm,不支援bundle
- 同樣,由於原因2,它不支援Web Worker
這傢伙還沒有維護這個項目,三月支持esm的壯舉請求也沒有得到回應。
於是我從hljs中提取了檢測模組,並fork了guesslang-js來修復上述問題,最終guesslang獲勝,結果是這樣的:
https://github.com/ray-d-song/guesslang-js
我覺得說的太多了,也許以後有人需要,所以我就發一下。
如果有人了解tensorflow.js,希望能推薦一些學習資料,我想進一步修改為web gpu計算以提高效率。
以上是如何偵測瀏覽器中的程式碼語言的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

JavaScript是現代Web開發的基石,它的主要功能包括事件驅動編程、動態內容生成和異步編程。 1)事件驅動編程允許網頁根據用戶操作動態變化。 2)動態內容生成使得頁面內容可以根據條件調整。 3)異步編程確保用戶界面不被阻塞。 JavaScript廣泛應用於網頁交互、單頁面應用和服務器端開發,極大地提升了用戶體驗和跨平台開發的靈活性。

JavaScript的最新趨勢包括TypeScript的崛起、現代框架和庫的流行以及WebAssembly的應用。未來前景涵蓋更強大的類型系統、服務器端JavaScript的發展、人工智能和機器學習的擴展以及物聯網和邊緣計算的潛力。

不同JavaScript引擎在解析和執行JavaScript代碼時,效果會有所不同,因為每個引擎的實現原理和優化策略各有差異。 1.詞法分析:將源碼轉換為詞法單元。 2.語法分析:生成抽象語法樹。 3.優化和編譯:通過JIT編譯器生成機器碼。 4.執行:運行機器碼。 V8引擎通過即時編譯和隱藏類優化,SpiderMonkey使用類型推斷系統,導致在相同代碼上的性能表現不同。

JavaScript是現代Web開發的核心語言,因其多樣性和靈活性而廣泛應用。 1)前端開發:通過DOM操作和現代框架(如React、Vue.js、Angular)構建動態網頁和單頁面應用。 2)服務器端開發:Node.js利用非阻塞I/O模型處理高並發和實時應用。 3)移動和桌面應用開發:通過ReactNative和Electron實現跨平台開發,提高開發效率。

Python更適合初學者,學習曲線平緩,語法簡潔;JavaScript適合前端開發,學習曲線較陡,語法靈活。 1.Python語法直觀,適用於數據科學和後端開發。 2.JavaScript靈活,廣泛用於前端和服務器端編程。

本文展示了與許可證確保的後端的前端集成,並使用Next.js構建功能性Edtech SaaS應用程序。 前端獲取用戶權限以控制UI的可見性並確保API要求遵守角色庫

從C/C 轉向JavaScript需要適應動態類型、垃圾回收和異步編程等特點。 1)C/C 是靜態類型語言,需手動管理內存,而JavaScript是動態類型,垃圾回收自動處理。 2)C/C 需編譯成機器碼,JavaScript則為解釋型語言。 3)JavaScript引入閉包、原型鍊和Promise等概念,增強了靈活性和異步編程能力。

我使用您的日常技術工具構建了功能性的多租戶SaaS應用程序(一個Edtech應用程序),您可以做同樣的事情。 首先,什麼是多租戶SaaS應用程序? 多租戶SaaS應用程序可讓您從唱歌中為多個客戶提供服務
