資訊

pakkau台羅拼音到漢字轉換的玩具

原刊於PTT臺灣語言板

小弟算講是閩南語維基ê顧站工,最近hām有志討論講閩南語維基(主要用POJ/TL)
寫ê議題,我著想講敢有會當kā羅馬字轉做漢字ê方法?

因為tse hām輸入法揀字原理相siâng,我最近tshiau著輸入法自動揀字ê方法,
其中一个是Hidden Markov Model。

gitweb 的架設使用

(最近更新:2024-03-22)

因為有點想要脫離FAANGM的影響(詳見前文),不想要利用GitHub,又想要仿效SourceHut的方式,來用傳統的方式管理專案,但也不想要在另一個網站註冊新帳號,所以就用自架網站和租用的託管主機來安裝。目前使用以下三個工具,以Clo為案例:

  • 共筆MediaWiki:簡介專案、彙整錯誤回報列表、其他相關文件也可以放進去(案例)
  • 郵件論壇(mailing list, Mailman):用來討論程式使用以及回報錯誤用(案例)
  • Nginx伺服器上的GitWeb:來放置、瀏覽並提供他人下載git的repo

因為考慮到其他用戶或出外時的我能夠即時通連錯誤,加上設定mailing list平臺很麻煩,還要和mail transfer agent這種郵件伺服器引擎的安裝打交道,所以使用web hosting託管提供的服務。雖然所提供的Mailman引擎的版本比較老。MediaWiki就用之前的個人維基。

但是比較麻煩的還有gitweb,雖然可以在線上瀏覽repo程式碼庫,但是設定比較麻煩,所以在此記錄下:

部落格遷移網址,另外不用Disqus討論系統。

部落格遷移網址

鑑於整合個人網路與資訊科技資源,並且計劃部分降低對FAANGM數位財團相關資源的使用,所以將部落格遷移到新網址,日後再遷站到自己的門口埕二號機。

新網址:blog.kianting.info。

最近也打算更新一下相簿和程式碼倉庫的放置位置,時程未定。初步成果(日後會擴增)如:

停用Disqus討論系統

鑑於討論量比較低,好幾年不到10條,而且為了安全特性,不用動態部落格,Disqus又有追蹤器(追蹤訪客瀏覽行為的程式)的疑慮,影響使用者權利。經評估,故撤掉Disqus的討論系統。

以前的迴響存檔如下(PDF),技術限制無法完全備份請海涵:

迴響存檔.pdf

感謝大家先前的留言,如果有反饋,可以用電郵聯絡。

在 A2hosting 用 AppImage deploy Rust rocket 這個 framework 的 app

Rust 的 Rocket 是一個後端框架 (framework)。除了有靜態型別語言的好處(比如減少runtime error)外,還有一個binary檔包全部,免除裝其他太多 library 或是框架 library 的問題。

因為自己的是網路租用的A2 site hosting 空間(Linux),想說為了物盡其用,所以想要把產生的 web app binary 放在上面執行,但想當然爾,還是缺相依性(空間提供的函式庫版本太舊)。後來想,既然 AppImage 可以包一個執行檔的諸多相依軟體或是函式庫,為何不用之包呢?

以下以放在 /path/to/exampleapp 這個 app 為例,講述我 deploy 的方法。

LaTeX斷行演算法

以下內容係參考網路上找到的LaTeX斷行演算法,加上一些修改而成。

使用程式筆記本的.ipynb檔撰寫,語言是OCaml,授權為MIT License。載點:

以下是程式筆記本檔內文:

1
2
3
4
5
(*有關於LaTeX使用於斷行的演算法

首先我們要制定一個字元(包含斷行後新生的連字號,以及空白)在斷行前、斷行後的寬度

*)

一個外行對依值型別的理解

依值型別 (dependent type) 是型別理論 (type theory) 的重要概念,也是FP的進階概念。因為概念很抽象,而且還要會點型別概念,方好入手。雖此係函數式程式語言的重要概念,但是許多程式人,會仰之彌高,進而生畏,降低學習意願,遑論相關係的定理證明了。

身為一個外行,之前筆者亦如是。對型別理論感到興趣之際,面對依值型別還是一頭霧水,不知何以理解。然最近稍理解些,所以做了這份筆記。

但是因為內文牽涉許多數學符號,為利閱讀,以Typst排版軟體製成PDF版:[下載連結]

門口埕記事1:用樹莓派 3 運作 Pleroma 要三思

對不起Mn̂g-kháu-tiânn(門口埕)最近暫停服務,於 2023-04-10 2:50am 前後重新啟用。

以下是關於從今年三月下旬許開始暫停服務的原因與 Pleroma 重灌的說明。

對於想要經營自己的 Pleroma 站臺,卻不想看底下的說明的,請記得:

千萬不要在 Raspberry Pi 3 運作連接 Fediverse relay 的 Pleroma 站臺!!

Tshian-bān M̄-THANG tī Raspberry Pi 3 pháng ū tsiap Fediverse relay–ê Pleroma tsām!!

On a Raspberry Pi 3, NEVER operate a Pleroma instance connected with any relay!!

很重要,用三語各說一次!


故障原因是此站臺,從大概三月底之前就開始有負載過重的問題,時常自動重開,查詢或是送出 request 屢屢出現錯誤,後來用各種調試 PostgreSQL 還是解決不了(就算標榜輕量,還是不用 SQLite),我記得連廢資料清除的 vacuum 類 SQL 指令都用了。

後來受不了負載問題,決定重裝,但是 dump 出來的資料庫二進位檔案,兩次 dump 結果都不一樣(= =),因此受不了而使用純文字指令匯出方式備份,結果匯出了超過 1G 的指令(= =”),就算上週末把資料庫砍掉重置,把大量的指令匯入進去,結果花了好幾個小時,使我懷疑到底是不是故障了。現在已經匯入資料庫完畢了,但還需要觀察後續到底有沒有問題。

究其原因可能問題,係因為連接 relay(中繼轉訊伺服器)所致。因為 Pleroma 站臺除非有大量的使用者,否則需要 relay 才能看到大量其他站外有趣的內容。但是因為往往會從 relay 送來大量外站的資訊,就算這個站臺目前只有一個人(除了管理員賬戶以外)是主要使用者,fo 的人也沒有很多,仍然還是會造成資料庫和 Pleroma 軟體需要頻繁處理,難以重負。

就算是重整 PostgreSQL 資料庫內容,vacuum 就花很多時間。感覺這種情況調資料庫軟體參數也不一定有效。

總之,如果要自己經營站臺,要花好多時間,要經營相依軟體很多且需要繁雜設定時,更麻煩,若是機器效能不好,更費時。除非對資料庫或是網站營運知識,包含資料庫設定,有被虐狂似的渴求。

先這樣試看看吧。希望麻煩短期內不要來了。如果真的不行就需要換伺服器到迷你機殼(如果空間夠則另做打算),並大升級硬體性能。我已經浪費了許多寶貴的業餘時間在這上面,人生苦短,已經這把年紀,不該這樣把可支配時間當太平洋的海水一樣揮霍。

如果要重灌 Pleroma,以下要注意:

ActivityPub 協定的基本教學(上)

(最近更新:2022-11-23,勘誤)

序言

隨着馬斯克入主推特後對內激進整飭的作爲,許多人想到避難目標 Mastodon。但是也不一定要入駐 Mastodon,因為 Mastodon 是利用去中心化 ActivityPub 協定跨伺服器傳遞訊息的,所以只要支援 ActivityPub 的 SNS 平臺,比如 Pleroma、MissKey 都可以使用。

另外鑑於有些人反映 Mastodon 的效率太慢,其實也可以自己製作支援 ActivityPub 的微網誌服務軟體。我之前本來想要做一組SNS,但是發現這個 side-project 會嚴重侵蝕自己的作息控制和身心健康,所以擱置了。

但是鑑於這個去中心化協定獲得的關注度很高,而網路上幾乎沒有華語的教學,從而沒有辦法百花齊放,推進這個技術的生態圈,洵為可惜,加上自己曾經參與一篇 Timmot 的教學的回饋,所以就用該教學來編譯成華語,希望能夠推動大家對這個協議的興趣。

如果這個教學有錯誤處請告訴我。另筆者不負責參考本教學執行的後果,還請注意。

好用的工具,使用於工作上

原載於PTT某板

  • 心智圖是好東西:

當您要想一篇新聞稿的時候,最好可以先擬大綱,增加後續送核的速度。然後細節可以用
開分支來寫。我個人建議用可以快速鍵操作的 FreeMind。

  • 有些項目符號或是不必要的換行,可以用 Regex101,佐以基礎的正規表達式(比如
    以數字後加點,代替數字項目符號的括號 ( )),可以用這個表達式:

修改前 regex 語法:

 ([)]

修改後 regex 語法:
\1.

  • 除非學形碼輸入法,建議可以使用自定義快速鍵+無調注音和用斷頭注音文輸入的
    程式,這樣不太會浪費時間在出入常用辭的調號。

  • 如果電腦是 Windows 10,可以用 WSL2 安裝 Linux 子系統的話,可以用 vim -d
    比較兩個純文字檔的差異,這樣重新送核能夠快速檢視問題是否修改畢。