Dịch HTML giữ nguyên đánh dấu của bạn.
Thẻ vẫn là thẻ. Thuộc tính vẫn là thuộc tính. Tên lớp, giá trị href, thuộc tính dữ liệu — không thay đổi gì cả. Chỉ văn bản hiển thị mà người dùng thực sự đọc được dịch.
Đánh dấu bị hỏng còn tệ hơn không dịch.
Gửi HTML qua API dịch tiêu chuẩn rất rủi ro. Thẻ bị dịch một phần. Giá trị thuộc tính bị hỏng. Tên lớp không nên thay đổi lại bị thay đổi. Kết quả trông đúng khi xem dưới dạng văn bản thuần nhưng bị hỏng khi hiển thị trên trình duyệt — và lỗi xảy ra một cách âm thầm. Với một trang web nhiều nội dung hoặc xuất CMS, sửa HTML bị hỏng trên 10 ngôn ngữ không phải là quy trình hợp lý.
Tệ hơn, các API dịch tiêu chuẩn thường dịch cả nội dung không nên thay đổi — tên lớp CSS, URL href, thuộc tính src, nhãn aria chứa định danh kỹ thuật, và thuộc tính dữ liệu. HTML kết quả không còn hiển thị đúng, và một số thay đổi tinh vi đến mức vượt qua kiểm tra hình ảnh trước khi gây lỗi khi chạy.
Với HTML tạo ra từ CMS, mẫu email hoặc bất kỳ HTML nào được xử lý theo chương trình, việc sửa chữa sau dịch không phải là tùy chọn. Nó trở thành chi phí bảo trì ẩn tăng lên theo mỗi lần cập nhật nội dung.
PolyLingo phân tích DOM trước khi dịch.
PolyLingo xử lý HTML của bạn như một tài liệu, không phải chuỗi văn bản. Nó duyệt cấu trúc DOM, xác định các nút văn bản chứa nội dung hiển thị, và chỉ gửi những nút đó đến mô hình dịch. Tên thẻ, giá trị thuộc tính, tên lớp, giá trị href, thuộc tính dữ liệu — không có gì về cấu trúc được mô hình dịch nhìn thấy. HTML đầu ra hợp lệ và cấu trúc giống hệt với đầu vào bạn gửi.
PolyLingo sử dụng bộ phân tích DOM thay vì xử lý HTML như văn bản thô. Trước khi dịch, HTML được phân tích thành cây nút. Mỗi nút được phân loại: các nút văn bản chứa ngôn ngữ tự nhiên được trích xuất để dịch, trong khi các nút phần tử, giá trị thuộc tính không ngôn ngữ (tên lớp, ID, href, src, thuộc tính dữ liệu), và nội dung không dịch được (script, style, khối mã) bị loại hoàn toàn.
Các nút văn bản đã dịch sau đó được chèn lại vào cấu trúc DOM gốc. HTML kết quả tương đương về mặt ngữ nghĩa với nguồn, với cấu trúc thẻ, giá trị thuộc tính và đánh dấu cấu trúc giống hệt. Chỉ có văn bản hiển thị thay đổi.
<article class="post">
<h1 class="post-title">How to build a multilingual site</h1>
<p>Building a <strong>multilingual website</strong> doesn't have to be
complicated. The key is choosing the right translation layer.</p>
<a href="/pricing" class="cta-button" aria-label="View pricing">
See our plans
</a>
<img src="/hero.png" alt="Multilingual platform dashboard" />
</article><article class="post">
<h1 class="post-title">Comment créer un site multilingue</h1>
<p>Créer un <strong>site web multilingue</strong> n'a pas à être
compliqué. La clé est de choisir la bonne couche de traduction.</p>
<a href="/pricing" class="cta-button" aria-label="Voir les tarifs">
Voir nos offres
</a>
<img src="/hero.png" alt="Tableau de bord de la plateforme multilingue" />
</article>Cái gì được dịch và cái gì được giữ nguyên
| Được dịch | Được giữ nguyên | |
|---|---|---|
| Nội dung văn bản giữa các thẻ | có | không |
| Thuộc tính title (nhãn truy cập) | có | không |
| Văn bản thay thế trên hình ảnh | có | không |
| Thuộc tính aria-label | có | không |
| Văn bản giữ chỗ trong ô nhập | có | không |
| Tên thẻ HTML | không | có |
| Thuộc tính lớp và ID | không | có |
| URL href và src | không | có |
| Thuộc tính dữ liệu | không | có |
| Khối script và style | không | có |
Những gì PolyLingo xử lý trong mọi bản dịch HTML
- ✓Tên thẻ và cấu trúc không bao giờ bị thay đổi
- ✓Tên lớp, ID, thuộc tính dữ liệu không bị ảnh hưởng
- ✓Giá trị href và src của liên kết được giữ nguyên chính xác
- ✓Chỉ các nút văn bản hiển thị được dịch
- ✓Ngôn ngữ RTL: thuộc tính dir được xử lý đúng
- ✓Hoạt động với trang đầy đủ, đoạn trích và thành phần
- ✓HTML lồng nhau — xử lý đúng mọi độ sâu lồng thẻ
- ✓HTML email — giữ nguyên style nội tuyến và bố cục bảng
Cách dịch nội dung HTML với PolyLingo
Gửi HTML của bạn đến API
Gửi POST nội dung HTML đến /v1/translate. Đặt định dạng là "html" hoặc bỏ qua — PolyLingo tự động phát hiện HTML từ nội dung. Bao gồm mã ngôn ngữ mục tiêu của bạn.
Nhận HTML đã dịch sạch sẽ
Phản hồi chứa một chuỗi HTML đã dịch cho mỗi ngôn ngữ mục tiêu. Mọi thẻ, lớp, ID và thuộc tính đều chính xác như bạn gửi. Chỉ có văn bản ngôn ngữ tự nhiên thay đổi.
Ghi vào CMS, mẫu hoặc tệp của bạn
Sử dụng HTML đã dịch trực tiếp trong CMS, trình tạo email, trình tạo trang tĩnh hoặc bất kỳ công cụ nào tiêu thụ HTML. Không cần xử lý hoặc sửa chữa sau.
Nơi cần dịch HTML
Xuất trang và bài viết CMS
Nền tảng CMS không đầu lưu trữ nội dung dưới dạng HTML hoặc rich text tuần tự hóa thành HTML. PolyLingo dịch nội dung này cho từng ngôn ngữ trong khi giữ nguyên cấu trúc và định dạng do CMS tạo.
Mẫu email
HTML email rất dễ hỏng — bố cục bảng, style nội tuyến và cấu trúc lồng sâu bị hỏng khi dịch qua công cụ dịch đơn giản. PolyLingo giữ nguyên tất cả.
Mô tả sản phẩm thương mại điện tử
Mô tả sản phẩm thường chứa HTML định dạng với danh sách có kiểu, chữ đậm và nội dung có cấu trúc. Dịch hàng loạt cần giữ nguyên định dạng chính xác để đầu ra hiển thị nhất quán qua các ngôn ngữ.
Câu hỏi thường gặp về dịch HTML
PolyLingo có dịch các thuộc tính như title và alt không?
Có. Thuộc tính alt trên hình ảnh, thuộc tính title trên phần tử, thuộc tính aria-label và thuộc tính placeholder trên ô nhập được xác định chứa văn bản ngôn ngữ tự nhiên và được dịch. Thuộc tính href và src, tên lớp, ID và thuộc tính dữ liệu không được dịch.
Còn JavaScript nội tuyến hoặc thuộc tính style thì sao?
Thẻ script và style không bao giờ được dịch — nội dung của chúng được giữ nguyên. Thuộc tính style nội tuyến (style="...") cũng được giữ nguyên chính xác. Chỉ có văn bản ngôn ngữ tự nhiên được dịch.
PolyLingo có xử lý HTML toàn trang bao gồm doctype và head không?
Có. PolyLingo có thể xử lý tài liệu HTML đầy đủ bao gồm doctype, head và body. Thẻ title, mô tả meta và thẻ Open Graph trong head có thể dịch được. URL canonical, meta charset và các thẻ meta kỹ thuật được giữ nguyên.
Nó có hoạt động với HTML tạo ra từ trình soạn thảo rich-text như ProseMirror hoặc TipTap không?
Có. HTML xuất ra từ trình soạn thảo rich-text tuần tự hóa thành HTML chuẩn. PolyLingo xử lý mọi HTML hợp lệ bất kể cách tạo ra. Bộ phân tích DOM hoạt động từ chuỗi HTML, không phải định dạng riêng của trình soạn thảo.
Xử lý các thực thể HTML như & hoặc © thế nào?
Thực thể HTML được giải mã trước khi dịch và mã hóa lại trong đầu ra. Thực thể đặt tên như &, ©, — được giữ nguyên. Thực thể số cũng được xử lý đúng. Đầu ra dịch sử dụng mã hóa thực thể giống nguồn.
Có giới hạn kích thước tệp cho dịch HTML không?
Yêu cầu dịch riêng lẻ giới hạn ở 64KB nội dung. Với tài liệu dài (bài viết dài, trang đầy đủ), cách khuyến nghị là chia theo ranh giới tự nhiên (mục, bài viết) và ghép lại sau dịch. Cách này cũng giúp chính xác sử dụng token.
Hướng dẫn liên quan
Dịch HTML của bạn mà không cần dọn dẹp.
Miễn phí. Không cần thẻ tín dụng. HTML hợp lệ đầu ra.
Bắt đầu dịch miễn phíDán bất kỳ HTML nào và xem chính xác cái gì được dịch và cái gì không.