一、自动化文件管理 1.在目录中对文件进行排序 1 2 3 4 5 6 7 8 9 10 11 12 import osfrom shutil import movedef sort_files (directory_path ): for filename in os.listdir(directory_path): if os.path.isfile(os.path.join(directory_path, filename)): file_extension = filename.split('.' )[-1 ] destination_directory = os.path.join(directory_path, file_extension) if not os.path.exists(destination_directory): os.makedirs(destination_directory) move(os.path.join(directory_path, filename), os.path.join(destination_directory, filename)
这个Python脚本通过根据文件扩展名将文件分类到子目录中来整理目录中的文件。
它识别文件扩展名并将文件移动到相应的子目录中。这对于清理下载文件夹或为特定项目组织文件非常有用。
2.删除空文件 1 2 3 4 5 6 7 8 import osdef remove_empty_folders (directory_path ): for root, dirs, files in os.walk(directory_path, topdown=False ): for folder in dirs: folder_path = os.path.join(root, folder) if not os.listdir(folder_path): os.rmdir(folder_path)
此Python脚本在指定目录中搜索并删除空文件夹。它可以帮助您保持整洁的文件夹结构,特别是在处理大量数据集时。
3.重命名多个文件 1 2 3 4 5 6 7 8 import osdef rename_files (directory_path, old_name, new_name ): for filename in os.listdir(directory_path): if old_name in filename: new_filename = filename.replace(old_name, new_name) os.rename(os.path.join(directory_path, filename), os.path.join(directory_path, new_filename))
这个Python脚本允许您同时重命名目录中的多个文件。它接受旧名称和新名称作为输入,并将符合指定条件的所有文件的旧名称替换为新名称。
二、用Python进行网络爬虫 1.从网站提取数据 1 2 3 4 5 6 7 import requestsfrom bs4 import BeautifulSoupdef scrape_data (url ): response = requests.get(url) soup = BeautifulSoup(response.text, 'html.parser' )
这个Python脚本利用requests和BeautifulSoup库从一个网站上爬取数据。它获取网页的内容,并使用BeautifulSoup解析HTML。
您可以自定义脚本以提取特定的数据,如标题、产品信息或价格。
2.批量下载图片 1 2 3 4 5 6 7 8 9 10 11 import requestsdef download_images (url, save_directory ): response = requests.get(url) if response.status_code == 200 : images = response.json() for index, image_url in enumerate (images): image_response = requests.get(image_url) if image_response.status_code == 200 : with open (f"{save_directory} /image_{index} .jpg" , "wb" ) as f: f.write(image_response.content)
这个Python脚本旨在从网站批量下载图片。它假设该网站提供一个返回图像URL数组的JSON API。
然后,脚本遍历这些URL并下载图片,将其保存到指定目录中。
3.自动化表单提交 1 2 3 4 5 6 import requestsdef submit_form (url, form_data ): response = requests.post(url, data=form_data) if response.status_code == 200 :
这个Python脚本通过发送带有表单数据的POST请求来自动化网站上的表单提交。
您可以通过提供URL和需要提交的必要表单数据来定制脚本。
三、文本处理和操作 1.在文本文件中计算单词数 1 2 3 4 5 6 def count_words (file_path ): with open (file_path, 'r' ) as f: text = f.read() word_count = len (text.split()) return word_count
这个 Python 脚本读取一个文本文件并计算其中包含的单词数量。
它可以用于快速分析文本文档的内容,或者跟踪写作项目中的字数统计。
2.查找和替换文本 1 2 3 4 5 6 7 def find_replace (file_path, search_text, replace_text ): with open (file_path, 'r' ) as f: text = f.read() modified_text = text.replace(search_text, replace_text) with open (file_path, 'w' ) as f: f.write(modified_text)
这个Python脚本在文件中搜索特定文本,并将其替换为所需的文本。
它可以帮助批量替换某些短语或纠正大型文本文件中的错误。
3.生成随机文本 1 2 3 4 5 6 7 import randomimport stringdef generate_random_text (length ): letters = string.ascii_letters + string.digits + string.punctuation random_text = '' .join(random.choice(letters) for i in range (length)) return random_text
这个Python脚本生成指定长度的随机文本。它可以用于测试和模拟,甚至可以作为创意写作的随机内容来源。
四、自动化电子邮件 1.发送个性化电子邮件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 import smtplibfrom email.mime.text import MIMETextfrom email.mime.multipart import MIMEMultipartdef send_personalized_email (sender_email, sender_password, recipients, subject, body ): server = smtplib.SMTP('smtp.gmail.com' , 587 ) server.starttls() server.login(sender_email, sender_password) for recipient_email in recipients: message = MIMEMultipart() message['From' ] = sender_email message['To' ] = recipient_email message['Subject' ] = subject message.attach(MIMEText(body, 'plain' )) server.sendmail(sender_email, recipient_email, message.as_string()) server.quit()
此Python脚本使您能够向一组收件人发送个性化的电子邮件。您可以自定义发件人的电子邮件、密码、主题、正文以及收件人电子邮件列表。
请注意,出于安全原因,在使用Gmail时应使用特定于应用程序的密码。
2.发送电子邮件附件 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 import smtplibfrom email.mime.multipart import MIMEMultipartfrom email.mime.base import MIMEBasefrom email import encodersdef send_email_with_attachment (sender_email, sender_password, recipient_email, subject, body, file_path ): server = smtplib.SMTP('smtp.gmail.com' , 587 ) server.starttls() server.login(sender_email, sender_password) message = MIMEMultipart() message['From' ] = sender_email message['To' ] = recipient_email message['Subject' ] = subject message.attach(MIMEText(body, 'plain' )) with open (file_path, "rb" ) as attachment: part = MIMEBase('application' , 'octet-stream' ) part.set_payload(attachment.read()) encoders.encode_base64(part) part.add_header('Content-Disposition' , f"attachment; filename= {file_path} " ) message.attach(part) server.sendmail(sender_email, recipient_email, message.as_string()) server.quit()
这个Python脚本允许您发送带有文件附件的电子邮件。只需提供发件人的电子邮件、密码、收件人的电子邮件、主题、正文以及要附加的文件路径即可。
3.自动电子邮件提醒 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 import smtplibfrom email.mime.text import MIMETextfrom datetime import datetime, timedeltadef send_reminder_email (sender_email, sender_password, recipient_email, subject, body, reminder_date ): server = smtplib.SMTP('smtp.gmail.com' , 587 ) server.starttls() server.login(sender_email, sender_password) now = datetime.now() reminder_date = datetime.strptime(reminder_date, '%Y-%m-%d' ) if now.date() == reminder_date.date(): message = MIMEText(body, 'plain' ) message['From' ] = sender_email message['To' ] = recipient_email message['Subject' ] = subject server.sendmail(sender_email, recipient_email, message.as_string()) server.quit()
此Python脚本根据指定日期发送自动电子邮件提醒。它对于设置重要任务或事件的提醒非常有用,确保您永远不会错过截止日期。
五、自动化Excel电子表格 1.读写Excel 1 2 3 4 5 6 7 8 import pandas as pddef read_excel (file_path ): df = pd.read_excel(file_path) return df def write_to_excel (data, file_path ): df = pd.DataFrame(data) df.to_excel(file_path, index=False )
此Python脚本使用pandas库从Excel电子表格中读取数据,并将数据写入新的Excel文件。
它使您能够以编程方式处理Excel文件,从而提高数据操作和分析效率。
2.数据分析和可视化 1 2 3 4 5 6 import pandas as pdimport matplotlib.pyplot as pltdef analyze_and_visualize_data (data ): pass
这个Python脚本使用pandas和matplotlib库进行数据分析和可视化。
它使您能够探索数据集,得出洞察,并创建数据的可视化表示。
3.合并多个工作表 1 2 3 4 5 6 7 8 9 import pandas as pddef merge_sheets (file_path, output_file_path ): xls = pd.ExcelFile(file_path) df = pd.DataFrame() for sheet_name in xls.sheet_names: sheet_df = pd.read_excel(xls, sheet_name) df = df.append(sheet_df) df.to_excel(output_file_path, index=False )
这个Python脚本将来自Excel文件中多个工作表的数据合并到一个工作表中。
当您的数据分散在不同的工作表中,但希望将它们整合以进行进一步分析时,这非常方便。
六、与数据库交互 1.连接到数据库 1 2 3 4 5 6 7 8 9 10 import sqlite3def connect_to_database (database_path ): connection = sqlite3.connect(database_path) return connection def execute_query (connection, query ): cursor = connection.cursor() cursor.execute(query) result = cursor.fetchall() return result
这个Python脚本允许您连接到SQLite数据库并执行查询。
您可以通过使用适当的Python数据库驱动程序将其调整为与其他数据库管理系统(如MySQL或PostgreSQL)一起使用。
2.执行SQL查询 1 2 3 4 5 6 7 import sqlite3def execute_query (connection, query ): cursor = connection.cursor() cursor.execute(query) result = cursor.fetchall() return result
这个Python脚本是一个通用的函数,用于在数据库上执行SQL查询。
您可以将查询作为参数传递给该函数,并与数据库连接对象一起使用,它将返回查询的结果。
3.数据备份和恢复 1 2 3 4 5 import shutildef backup_database (database_path, backup_directory ): shutil.copy(database_path, backup_directory) def restore_database (backup_path, database_directory ): shutil.copy(backup_path, database_directory)
这个Python脚本允许您在需要时创建数据库备份并恢复它们。这是一项预防措施,用于保护您的宝贵数据免受意外丢失。
七、自动化图像编辑 1.图像调整大小和裁剪 1 2 3 4 5 6 7 8 9 10 from PIL import Imagedef resize_image (input_path, output_path, width, height ): image = Image.open (input_path) resized_image = image.resize((width, height), Image.ANTIALIAS) resized_image.save(output_path) def crop_image (input_path, output_path, left, top, right, bottom ): image = Image.open (input_path) cropped_image = image.crop((left, top, right, bottom)) cropped_image.save(output_path)
此Python脚本使用Python Imaging Library(PIL)来调整大小和裁剪图像。
它可以帮助准备不同显示分辨率或特定用途的图像。
2.向图像添加水印 1 2 3 4 5 6 7 8 9 10 from PIL import Imagefrom PIL import ImageDrawfrom PIL import ImageFontdef add_watermark (input_path, output_path, watermark_text ): image = Image.open (input_path) draw = ImageDraw.Draw(image) font = ImageFont.truetype('arial.ttf' , 36 ) draw.text((10 , 10 ), watermark_text, fill=(255 , 255 , 255 , 128 ), font=font) image.save(output_path)
这个Python脚本给图像添加水印。您可以自定义水印文本、字体和位置,以个性化您的图片。
3.创建图像缩略图 1 2 3 4 5 6 from PIL import Imagedef create_thumbnail (input_path, output_path, size=(128 , 128 ) ): image = Image.open (input_path) image.thumbnail(size) image.save(output_path)
这个Python脚本从原始图像创建缩略图,可以用于生成预览图像或减小图像大小以便在网站上更快加载。
八、数据清洗和转换 1.从数据中删除重复项 1 2 3 4 5 import pandas as pddef remove_duplicates (data_frame ): cleaned_data = data_frame.drop_duplicates() return cleaned_data
这个Python脚本利用pandas从数据集中删除重复行。这是一种简单而有效的方法,可以确保数据完整性并改善数据分析。
2.数据规范化 1 2 3 4 5 import pandas as pddef normalize_data (data_frame ): normalized_data = (data_frame - data_frame.min ()) / (data_frame.max () - data_frame.min ()) return normalized_data
这个Python脚本使用最小-最大归一化技术对数据进行规范化。
它将数据集中的值缩放到0和1之间的范围,使得比较不同特征更加容易。
3.处理缺失值 1 2 3 4 5 import pandas as pddef handle_missing_values (data_frame ): filled_data = data_frame.fillna(method='ffill' ) return filled_data
这个 Python 脚本使用 pandas 处理数据集中的缺失值。
它使用前向填充方法,将缺失值填充为前一个非缺失值。
九、自动化PDF操作 1.从PDF中提取文本 1 2 3 4 5 6 7 8 9 10 import PyPDF2def extract_text_from_pdf (file_path ): with open (file_path, 'rb' ) as f: pdf_reader = PyPDF2.PdfFileReader(f) text = '' for page_num in range (pdf_reader.numPages): page = pdf_reader.getPage(page_num) text += page.extractText() return text
这个Python脚本使用PyPDF2库从PDF文件中提取文本。
它读取PDF的每一页,并将提取的文本编译成一个字符串。
2.合并多个PDF文件 1 2 3 4 5 6 7 8 9 import PyPDF2def merge_pdfs (input_paths, output_path ): pdf_merger = PyPDF2.PdfMerger() for path in input_paths: with open (path, 'rb' ) as f: pdf_merger.append(f) with open (output_path, 'wb' ) as f: pdf_merger.write(f)
这个Python脚本将多个PDF文件合并成一个单独的PDF文档。
它非常方便,可以将独立的PDF报告、演示文稿或其他文档合并为一个统一的文件。
3.添加密码保护 1 2 3 4 5 6 7 8 9 10 11 12 import PyPDF2def add_password_protection (input_path, output_path, password ): with open (input_path, 'rb' ) as f: pdf_reader = PyPDF2.PdfFileReader(f) pdf_writer = PyPDF2.PdfFileWriter() for page_num in range (pdf_reader.numPages): page = pdf_reader.getPage(page_num) pdf_writer.addPage(page) pdf_writer.encrypt(password) with open (output_path, 'wb' ) as output_file: pdf_writer.write(output_file)
此Python脚本为PDF文件添加密码保护。
它使用密码对PDF进行加密,确保只有拥有正确密码的人才能访问内容。
转载请注明来源,欢迎对文章中的引用来源进行考证,欢迎指出任何有错误或不够清晰的表达。可以在下面评论区评论,也可以邮件至 richffan@outlook.com