Làm thế nào để xuất sạch từ Google Docs sang HTML

Tôi là người ủng hộ thực sự của Google Documents. Nó miễn phí, trong đám mây và lý tưởng cho các nhà văn trong số chúng ta, những người không muốn trả tiền cho một bộ phần mềm văn phòng đắt tiền. Nó có thể không mạnh mẽ như đối thủ cạnh tranh cao cấp của nó nhưng nó làm tất cả những điều mà hầu hết chúng ta cần một trình xử lý văn bản để làm. Ngoại trừ HTML xuất sạch. Vì lý do nào đó, Tài liệu không thể xuất HTML đúng cách có nghĩa là bạn cần làm một công việc nhỏ. Đây là cách để xuất sạch từ Google Documents sang HTML.

Google Documents lý tưởng cho các nhóm hoặc dịch giả tự do cộng tác trên một tài liệu. Bạn có thể thêm chút của bạn và tạo ra một số nội dung thực sự cần thiết. Với tính năng kiểm soát phiên bản và khả năng quản lý nhiều đầu vào, Google Tài liệu sẽ giúp bạn thực hiện các dự án cộng tác ngắn. Đối với hầu hết nội dung, xuất sang định dạng khác chỉ là vấn đề Lưu dưới dạng hoặc sao chép và dán. Đối với HTML, nó có liên quan nhiều hơn một chút.

Google Documents không có tùy chọn Xuất sang HTML nhưng không phải lúc nào cũng xuất hiện và mã không thường rất sạch sẽ. Điều đó có nghĩa là bạn có một số việc phải làm để làm sạch nó và làm cho nó sẵn sàng cho web.

Nếu bạn đã dành nhiều ngày tạo nội dung để xuất sang WordPress hoặc CMS khác và đã tiêu tốn rất nhiều năng lượng cho việc tạo kiểu, sao chép và dán không phải là một tùy chọn. Bạn phải xuất dưới dạng HTML để duy trì hầu hết kiểu đó.

Xuất từ ​​Google Tài liệu sang HTML

Có vẻ như tôi không phải là người duy nhất gặp sự cố khi xuất HTML sạch từ Google Documents. Rất nhiều người đã có cùng một vấn đề. May mắn thay, một vài trong số họ là xa thông minh hơn tôi và đã viết các công cụ để khắc phục vấn đề này. Tôi đã thử một vài công cụ khác nhau, một tập lệnh GoogleDoc2Html và một vài ứng dụng web. Mỗi công việc đã hoàn thành.

GoogleDoc2Html

GoogleDoc2Html bắt đầu như một công cụ được tạo ra bởi Omar AL Zabir nhưng đã được cải tiến và cải tiến bởi Jim Burch. Đây là tập lệnh bạn thêm vào Google Documents để xóa các xuất HTML và hoạt động tốt.

Dưới đây là cách sử dụng:

  1. Mở tài liệu bạn muốn xuất trong Google Tài liệu
  2. Chuyển đến trình đơn Công cụ, chọn 'Trình chỉnh sửa tập lệnh'.
  3. Sao chép và dán mã GoogleDocs2Html từ GitHub vào trình chỉnh sửa tập lệnh.
  4. Điều hướng đến Tệp và Lưu dưới dạng 'GoogleDoc2Html'.
  5. Điều hướng đến Chạy và chọn 'ConvertGoogleDocToCleanHtml'.
  6. Chọn Quyền xem xét khi cửa sổ bật lên xuất hiện.
  7. Nhấp vào tiếp tục để cấp quyền.

Sau đó, tập lệnh sẽ làm sạch đầu ra HTML từ Google Documents và gửi cho bạn kết quả qua email. Email sẽ đến trong vòng vài phút nhưng có thể mất nhiều thời gian hơn tùy thuộc vào kích thước của tài liệu.

Một điều bạn cần biết về việc sử dụng GoogleDoc2Html là nó là một kịch bản sử dụng duy nhất. Nó sẽ dọn dẹp và xuất một tài liệu cho bạn nhưng bạn sẽ cần phải lặp lại toàn bộ quá trình này mỗi khi bạn muốn sử dụng nó.

HTML Tidy

HTML Tidy là một công cụ nhỏ gọn, hoạt động tương tự như GoogleDoc2Html nhưng bên ngoài hệ sinh thái của Google. Có một plugin Notepad ++ độc lập và rất nhiều nhánh khác có thể được sử dụng theo những cách khác. Các tệp nhị phân và nguồn có sẵn từ liên kết trang web ở trên. Có các phiên bản Mac OS X. Đối với Windows, tốt nhất bạn nên sử dụng plugin Notepad ++.

  1. Mở Notepad ++ và chọn? biểu tượng menu.
  2. Chọn Nhận thêm plugin. Thao tác này sẽ mở một trang trình duyệt tại trang web Notepad ++.
  3. Tìm kiếm 'gọn gàng' và chọn TextFX HTML Tidy.
  4. Làm theo hướng dẫn ở đầu trang để định cấu hình plugin.

Phải mất một vài phút để làm cho nó hoạt động nhưng nếu bạn sử dụng Notepad ++ để quản lý văn bản của bạn, nó là một công cụ hữu ích để có xung quanh. Không giống như GoogleDoc2Html, bạn có thể sử dụng nó nhiều lần.

Trình dọn dẹp HTML

Nếu kiểu dáng ít vấn đề hơn, các trang web như HTML Cleaner, HTML Tidy, HTMLCleanup và những trang khác đều có thể trợ giúp. Đó là các ứng dụng web nơi bạn có thể dán HTML của mình từ Google Documents và ứng dụng sẽ giúp bạn dọn dẹp nó. Có khả năng là định dạng của bạn có thể bị rối tung một chút nhưng hầu hết bố cục của bạn sẽ vẫn nguyên vẹn. Khi tôi thử nghiệm nó, tiêu đề và siêu liên kết vẫn còn nguyên vẹn nhưng một vài từ in đậm và in nghiêng đã được loại bỏ. Họ vẫn còn giá trị sử dụng mặc dù.

Dù bạn sử dụng công cụ nào để xuất từ ​​Google Documents để làm sạch HTML, bạn sẽ cần phải kiểm tra mã theo cách thủ công để đảm bảo mã đó tốt. Ngay cả với điều này, nó tốt hơn nhiều so với việc thay đổi đánh dấu thủ công trong Tài liệu trước khi bạn xuất!

Xem Thêm