建議檔名：批次txt→html_with標題標籤.py

📘 TXT 小說自動轉換 HTML 工具

這是一款 將 TXT 小說轉換為 HTML 檔案 的小工具，方便後續使用 Sigil 或其他 EPUB 編輯器進行匯入與排版。
支援 單檔處理 與 批次處理，可依章節分割為多個 HTML 檔，並自動輸出到各自的資料夾。

✨ 功能特色

自動編碼偵測
支援常見的 TXT 編碼（UTF-8、BIG5、GBK），自動轉換為 UTF-8 輸出，免去亂碼困擾。

多檔批次處理
可同時處理多本 TXT 小說，每本小說會自動建立 獨立資料夾，避免檔案混雜。

章節分割選項

可選擇 整本合併單一 HTML

或依 章節標題關鍵字（如「第〇章」「第一話」「序章」「終章」等）自動切分為多個 HTML 檔。

輸出結構清晰

每本小說獨立資料夾

每章節對應一個 HTML 檔案

檔名以流水號排序，確保 Sigil 匯入後章節順序正確

HTML 章節標題格式

預設使用 <h3> 標記章節標題

方便後續在 Sigil 中建立目錄（TOC）

可雙擊執行
執行後會停留在視窗，不會自動關閉，方便檢視輸出訊息。

📂 使用流程

將小說 TXT 檔放在同一資料夾

雙擊執行程式

選擇是否要分割章節

程式會自動產生對應的 HTML 檔案

打開 Sigil → 匯入 HTML → 編輯 → 另存 EPUB

✅ 適用場合

想把 TXT 小說轉成 EPUB，保留清晰章節結構

處理大量 TXT 小說，快速完成 HTML 分割

搭配 Sigil 或其他 EPUB 工具，自動生成目錄

📌 總結：
這是一個 輕巧實用 的 TXT → HTML 轉換工具，特別針對 小說章節化處理 進行設計。
只需簡單操作，就能快速得到乾淨、可匯入的 HTML 檔案，讓你專注在 EPUB 編輯與美化排版。

📖 範例展示

原始 TXT：

第一章開端　　這是一段測試文　　換行後繼續小說內容。 第二章遭遇　　新的章節開始。

轉換後 HTML：

<h3>第一章 開端</h3><p>　　這是一段測試文字。</p<p>　　換行後繼續小說內容。</p> <h3>第二章 遭遇</h3><p>　　新的章節開始。</p>

📌 注意事項

預設使用 <h3> 包覆章節，方便之後手動加入 <h2> 做「分卷」。
（ <h1> 做「分書」）

章節數量極大（上千章）的情況下，建議用 目錄.TXT 輔助人工切割成數卷，避免 EPUB 載入過慢。

📂 輸出結構範例

output/

┣━ 小說A/

│ ┣━ 小說A.html （單檔模式）

│ ┣━ 0001.html （多檔模式）

│ ┣━ 0002.html

│ ┗━ 小說A_目錄.txt

┣━ 小說B/

│ ┣━ 小說B.html

│ ┗━ 小說B_目錄.txt

┗━ log.txt （批次處理紀錄）

假設處理的小說 TXT 檔名是 《星辰之路.txt》，程式輸出後的資料夾會長這樣：

星辰之路/│├─ 星辰之路.html ← 單一完整 HTML（含全部章節）├─ 星辰之路_目錄.TXT ← 章節標題清單（方便人工分卷）│├─ 0001.html ← （可選）每章獨立 HTML├─ 0002.html├─ 0003.html│ ...└─ 0123.html

如果選擇「不分割章節」，只會輸出 星辰之路.html + 星辰之路_目錄.TXT。

如果選擇「分割章節」，則會多出 0001.html、0002.html …… 等子檔案，檔名排序規則對 Sigil 與 EPUB 友好。

程式碼：

（複製以下文字，貼入純文字檔中，存檔後將副檔名設定為 .py）
【可直接在檔案總管雙擊執行】

- 批次處理輸入資料夾內所有 .txt 檔（每本小說建立獨立輸出資料夾）

- 章節偵測：結合「關鍵字正則」與「無縮排行」做判斷（預設套用 <h3>）

- 可選擇：單一整本 HTML 或依章節分割成多個 HTML（檔名以數字排序，避免中文檔名亂碼）

r'(?:第[零一二三四五六七八九十百千〇○0-9０-９]+[章回話節卷集篇]|' # 第X章/回/話...

COMMON_ENCODINGS = ['utf-8-sig', 'utf-8', 'cp950', 'big5', 'gbk', 'shift_jis', 'latin-1']

"""安全讀檔：會先以二進位讀入，再嘗試偵測或逐一嘗試編碼列表"""

"""判斷開頭是否沒有縮排（既不是半形空白也不是全形空白）"""

# 頁碼的情況：如獨立頁碼，常作為章分隔點（視為下一行章節）

"""以空行作為段落分隔，保留段內換行為斷行，並保留行首縮排（不 strip left）"""

會收集符合 CHAPTER_PATTERN 或無縮排行的短行作為章節開頭（index）

if is_no_indent(ln) and len(ln.strip()) <= TITLE_MAX_LEN and len(ln.strip()) >= 1:

# 頁碼邏輯：如果本行為頁碼且前後內容像正文，則下一行可能是章頭

# 若段落本身可能包含多行，將每行視為段落內的換行（這裡我們仍用單個 <p> 包整段）

def process_single_book(txt_path, output_root, split_mode=False, charset_out='utf-8'):

full_html = build_single_html(book_basename, full_paragraphs, charset=charset_out)

ch_html = build_single_html(f'{book_basename} - {idx:0{FILENAME_DIGITS}d}', chapter_paras, charset=charset_out)

index_lines = ['<!doctype html>', '<html>', '<head>', f'<meta charset="{charset_out}">', f'<title>{escape_html(book_basename)} - 章節目錄</title>', '</head>', '<body>', f'<h1>{escape_html(book_basename)}</h1>', '<ul>']

print('功能簡介：每本小說會建立獨立輸出資料夾，輸出 UTF-8 HTML，並產生章節目錄。')

print('注意：原始檔案編碼會自動嘗試偵測（若失敗會詢問），輸出一律為 UTF-8。')

input_folder = input('請輸入輸入資料夾路徑（預設為目前資料夾）: ').strip('" ')

output_root = input('請輸入輸出資料夾（預設為 ./output）: ').strip('" ')

choice = input('是否將每本小說依章節分割為多個 HTML 檔？(Y=分割 / N=不分割，預設 N): ').strip().lower()

txt_files = [os.path.join(input_folder, f) for f in os.listdir(input_folder) if f.lower().endswith('.txt')]

info = process_single_book(txt, output_root, split_mode=split_mode_global, charset_out='utf-8')

summary = f"{info['book']} -> 章節: {info['chapters']} ; 輸出: {info['out_folder']}"

論壇

腳本05-02：完本小說TXT轉html(批次各檔各章標題加標籤)

建議檔名：批次txt→html_with標題標籤.py

📘 TXT 小說自動轉換 HTML 工具

✨ 功能特色

📂 使用流程

✅ 適用場合

📖 範例展示

📌 注意事項

📂 輸出結構範例

內容標籤

最新更新

檢舉回應

論壇

腳本05-02：完本小說TXT轉html(批次各檔各章標題加標籤)

建議檔名： 批次txt→html_with標題標籤.py

📘 TXT 小說自動轉換 HTML 工具

✨ 功能特色

📂 使用流程

✅ 適用場合

📖 範例展示

📌 注意事項

📂 輸出結構範例

內容標籤

最新更新

建議檔名：批次txt→html_with標題標籤.py