如何从剪贴板获取HTML格式数据
学习笔记作者:admin日期:2025-06-05点击:185
摘要:介绍如何使用Python和pywin32库从Windows剪贴板中读取HTML格式数据,并与纯文本数据兼容。
获取剪贴板中的HTML数据
在某些场景下,我们需要从剪贴板中获取HTML格式的内容,而不仅仅是纯文本。下面是如何通过Python实现这一功能。
代码实现
import win32clipboard
import win32con
import hashlib
def get_clipboard_content():
    win32clipboard.OpenClipboard()
    
    try:
        # 检查是否有 HTML 格式
        if win32clipboard.IsClipboardFormatAvailable(win32con.CF_HTML):
            html_data = win32clipboard.GetClipboardData(win32con.CF_HTML)
            win32clipboard.CloseClipboard()
            # 提取实际 HTML 内容(跳过 CF_HTML 的头部信息)
            # 头部以 "Version" 开始,真正的内容在后面
            if html_data.startswith(b'Version'):
                # 找到第一个 "关键点说明
- 通过 win32clipboard.CF_HTML判断是否存在 HTML 格式数据。
- HTML 数据在剪贴板中包含头部信息,需要跳过这些部分才能得到实际的 HTML 内容。
- 如果剪贴板中没有 HTML 格式,则回退到处理纯文本。
- 通过 hashlib.md5对内容生成唯一标识。
关键词
python, windows, clipboard, html, cf_html