做一份网站动态图多少钱设计师要考什么证

张小明 2025/12/30 16:08:19
做一份网站动态图多少钱,设计师要考什么证,国外网站源代码,在线做插画的网站Python读取txt文件与其他文件的区别探究#xff01; 1. 根本区别#xff1a;文本文件 vs 二进制文件 # 查看文件类型 import osfiles [test.txt, test.docx, test.xlsx, test.pdf, test.html, test.json] 十一剑的CS_DN博客出品 for …Python读取txt文件与其他文件的区别探究1.根本区别文本文件 vs 二进制文件# 查看文件类型importos files[test.txt,test.docx,test.xlsx,test.pdf,test.html,test.json]十一剑的CS_DN博客出品forfileinfiles:ifos.path.exists(file):withopen(file,rb)asf:# 二进制模式查看headerf.read(100)# 读取前100字节print(f{file:15}头部:{header[:20]}...)2.各种文件的本质和读取原理a. TXT 文本文件# 最简单纯字符流 换行符# 文件内容: Hello\nWorld\n# 存储格式: 48 65 6C 6C 6F 0A 57 6F 72 6C 64 0A (ASCII/UTF-8编码)withopen(test.txt,r)asf:# 文本模式linesf.readlines()# 按换行符分割十一剑的CS_DN博客出品# 底层读取字节流 → 解码为字符串 → 按\n分割b. HTML 文件# 本质也是文本文件但有标签结构# !DOCTYPE html# htmlbodypHello/p/body/htmlwithopen(page.html,r,encodingutf-8)asf:# 1. 可以像文本一样逐行读取forlineinf:print(line)十一剑的CS_DN博客出品# 2. 但通常用解析器读取结构化数据frombs4importBeautifulSoup soupBeautifulSoup(f,html.parser)# 解析器识别的是标签、属性、文本内容c. JSON 文件# 本质文本文件但有严格的语法结构# {name: John, age: 30, hobbies: [reading, swimming]}importjsonwithopen(data.json,r)asf:# 1. 文本模式读取contentf.read()# 得到字符串十一剑的CS_DN博客出品# 2. JSON解析器识别的是# - 大括号 {} 表示对象# - 中括号 [] 表示数组# - 冒号 : 分隔键值# - 逗号 , 分隔元素datajson.loads(content)# 解析为Python数据结构d. Excel 文件.xlsx# 本质ZIP压缩包 XML文件# 实际是多个文件# - [Content_Types].xml# - xl/workbook.xml# - xl/worksheets/sheet1.xml# - xl/sharedStrings.xml# - xl/styles.xmlimportzipfile# 解压查看内部结构withzipfile.ZipFile(test.xlsx,r)asz:print(z.namelist())# 读取工作表内容withz.open(xl/worksheets/sheet1.xml)asf:xml_contentf.read().decode(utf-8)# 识别的是XML标签row r1c rA1v100/v/c/row十一剑的CS_DN博客出品# 使用库读取importopenpyxl wbopenpyxl.load_workbook(test.xlsx)wswb.active# openpyxl解析的是单元格坐标、公式、样式等e. Word 文件.docx# 本质也是ZIP压缩包 XML# 包含# - word/document.xml # 主要内容# - word/styles.xml # 样式# - word/_rels/ # 关系importzipfileimportxml.etree.ElementTreeasETwithzipfile.ZipFile(test.docx,r)asz:# 读取主文档withz.open(word/document.xml)asf:xml_contentf.read()rootET.fromstring(xml_content)# 识别XML命名空间和标签# w:p段落/w:p# w:r文本运行/w:r# w:t文本内容/w:t十一剑的CS_DN博客出品# 使用库读取fromdocximportDocument docDocument(test.docx)# python-docx解析的是段落、样式、表格、图片等f. PDF 文件# 本质二进制格式有固定结构# PDF结构# %PDF-1.7 # 头部# 1 0 obj # 对象1# /Type /Catalog# /Pages 2 0 R # endobj# 2 0 obj # 对象2页面树# ...# xref # 交叉引用表# trailer # 尾部# %%EOF # 结束标记# 原始查看withopen(test.pdf,rb)asf:headerf.read(1000)# 识别的是对象引用、流、字典、操作符等十一剑的CS_DN博客出品# 使用库读取importPyPDF2withopen(test.pdf,rb)asf:readerPyPDF2.PdfReader(f)# PyPDF2解析的是页面树、内容流、字体、图像等3.各种文件解析的识别内容对比表文件类型本质格式解析器识别的内容读取方式TXT纯文本换行符、编码字符按字节/字符流HTML文本标签标签、属性、文本节点DOM树解析JSON结构化文本大括号、中括号、冒号、逗号语法解析器ExcelZIPXML工作表、单元格、公式、样式解压XML解析WordZIPXML段落、样式、表格、图片解压XML解析PDF二进制结构化对象、流、字典、操作符二进制解析“”“十一剑的CS_DN博客出品”“”4.底层原理深度对比# 模拟各种解析器的工作方式概念代码classFileParser:不同文件解析器的概念实现十一剑的CS_DN博客出品defparse_txt(self,content):TXT按换行符分割returncontent.split(\n)defparse_html(self,content):HTML解析标签树# 简化版实际更复杂tags[]i0whileilen(content):ifcontent[i]:# 找到标签jcontent.find(,i)tagcontent[i:j1]tags.append(tag)ij1else:i1returntagsdefparse_json(self,content):JSON解析结构化数据# 简化版importjsonreturnjson.loads(content)defparse_excel_xml(self,xml_content):Excel XML解析# 查找单元格cells[]start0whileTrue:# 查找 c 标签c_startxml_content.find(c ,start)ifc_start-1:break# 查找值v_startxml_content.find(v,c_start)v_endxml_content.find(/v,v_start)ifv_start!-1andv_end!-1:valuexml_content[v_start3:v_end]cells.append(value)startc_start1returncellsdefparse_pdf_objects(self,binary_data):PDF对象解析# PDF对象示例1 0 obj ... endobjobjects[]data_strbinary_data.decode(latin-1,errorsignore)obj_start0whileTrue:# 查找 objobj_posdata_str.find( obj,obj_start)ifobj_pos-1:break# 查找 endobjend_posdata_str.find(endobj,obj_pos)ifend_pos-1:breakobj_contentdata_str[obj_pos:end_pos]objects.append(obj_content)obj_startend_pos6returnobjects5.实际文件结构示例# 创建各种文件并查看原始内容importjsonimportpandasaspdfromdocximportDocument# 1. 创建JSON文件data{users:[{name:Alice,age:25},{name:Bob,age:30}]}withopen(test.json,w)asf:json.dump(data,f,indent2)# 查看原始内容withopen(test.json,rb)asf:print(JSON原始内容前200字节:)print(f.read(200))# 看到的是{\n users: [\n {\n name: Alice,\n age: 25\n },\n ...# 2. 创建简单的Excel文件dfpd.DataFrame({A:[1,2],B:[3,4]})df.to_excel(test.xlsx,indexFalse)十一剑的CS_DN博客出品# 查看ZIP结构importzipfilewithzipfile.ZipFile(test.xlsx)asz:print(\nExcel文件内部结构:)fornameinz.namelist():ifsheetinname:print(f{name})withz.open(name)asf:contentf.read(500).decode(utf-8)print(f 内容示例:{content[:200]}...)# 3. 创建PDF并查看结构fromreportlab.pdfgenimportcanvas ccanvas.Canvas(test.pdf)c.drawString(100,750,Hello PDF)c.save()withopen(test.pdf,rb)asf:print(\nPDF文件头部:)print(f.read(500).decode(latin-1,errorsignore))6.专业库如何工作# 以PDF为例看专业解析器的工作流程classSimplePDFParser:简化的PDF解析器概念def__init__(self,filename):self.filenamefilenamedefparse(self):withopen(self.filename,rb)asf:# 1. 验证PDF头部headerf.read(8)ifnotheader.startswith(b%PDF-):raiseValueError(不是有效的PDF文件)# 2. 定位交叉引用表f.seek(-50,2)# 从末尾开始tailf.read()# 3. 查找xrefxref_postail.find(bxref)# 4. 读取对象# ... 复杂解析过程return{pages:[],fonts:[],images:[]}# 实际使用专业库importPyPDF2十一剑的CS_DN博客出品defanalyze_pdf_structure(filename):分析PDF结构withopen(filename,rb)asf:readerPyPDF2.PdfReader(f)print(fPDF版本:{reader.pdf_header})print(f页数:{len(reader.pages)})print(f元数据:{reader.metadata})# 查看第一页的内容流ifreader.pages:pagereader.pages[0]if/Contentsinpage:contentspage[/Contents]ifhasattr(contents,get_data):datacontents.get_data()print(f内容流大小:{len(data)}字节)敲黑板十一剑的CS_DN博客TXT/HTML/JSON都是文本文件按字符读取TXT识别换行符HTML识别标签和属性JSON识别语法结构Excel/Word (.docx)ZIP压缩的XML文件需要解压后解析XML识别的是结构化文档元素PDF复杂的二进制格式有严格的内部结构对象、流、字典需要专门的二进制解析器图像/音频/视频又是完全不同的二进制格式识别的是像素、音频采样、视频帧等核心区别文本文件处理字符和编码结构化文档处理标记语言和对象模型二进制格式处理字节流和特定数据结构每种文件格式都有其独特的文件签名Magic Number和内部结构解析器需要针对性地设计和实现。
版权声明:本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!

扶风做企业网站企业所得税怎么算2021

终极解决方案:5步彻底消除Windows手柄驱动冲突问题 【免费下载链接】DS4Windows Like those other ds4tools, but sexier 项目地址: https://gitcode.com/gh_mirrors/ds/DS4Windows 手柄驱动冲突是Windows游戏玩家最头疼的问题之一,特别是当你同时…

张小明 2025/12/28 14:50:04 网站建设

html5手机网站开发王野天的照片

上午写量化模型,下午码理论批判?别慌,你的“学术变形金刚”已加载多套思维系统!各位在学科边界反复“横跳”的创新者们,是否经常感到人格分裂?面对工科导师要求的“数据驱动、结论明确”,和人文…

张小明 2025/12/28 18:37:43 网站建设

微网站风格门诊部网站建设

FaceFusion在心理健康研究中的辅助应用前景在临床心理学实验室里,研究人员常常面临一个棘手的矛盾:如何既精确控制实验变量,又保证情绪刺激材料具备足够的真实感?传统的表情图片库虽然标准化程度高,但人物固定、表情僵…

张小明 2025/12/28 22:33:16 网站建设

学院网站设计流程wordpress主题官方

华为云国际站代理商的 TaurusDB 成本优化,核心是通过架构解耦、存储压缩、弹性扩缩、读写分离、免改造迁移与 HTAP 融合六大抓手,帮客户实现 “采购 - 运维 - 扩容 - 灾备” 全链路降本,整体 TCO 较原生 MySQL / 传统商业库降低 40%-70%&…

张小明 2025/12/28 13:36:26 网站建设

淄博网站建设专家wordpress怎么添加单页模版

从零开始理解AUTOSAR:一个工程师的实战入门指南你有没有遇到过这样的情况?刚接手一个新的ECU项目,代码里满屏都是Rte_Read()、Com_SendSignal()这类“黑盒函数”,却不知道它们背后是怎么工作的。想改个信号,结果发现要…

张小明 2025/12/28 16:59:21 网站建设

免费html网站模板下载怎么做一家网站

本文所有知识点均用于网络安全防御技术学习,攻击手段仅可在合法授权的靶机测试环境中使用。未经授权侵入他人系统、窃取信息属违法行为,将承担相应法律责任。网络安全的核心是 “攻防兼备”,掌握攻击手段的同时,更要牢记防护使命&…

张小明 2025/12/28 11:07:56 网站建设