博客
关于我
1001. A+B Format (20)
我最近在准备ACM竞赛题目时,遇到了一个看似简单却让我花了不少时间解决的题目。刚开始接触C++编程,感觉这道题虽然简单,但还是花了一个小时才完成。最开始,我想直接用几个if语句来判断数值的正负,但提交后总是有错误。我后来检查发现,问题出在取余运算上。最初我用%1000或者%1000000来处理数值,但发现有些情况下会得到0,这让我误以为是取后面几位数字。比如,1000000%1000000=0,我......
阅读量:797 次
2023-03-23
10-docx_bookmark_processor.py
<html><head></head><body><div></div><pre>类`DocxBookmarkProcessor`用于处理Word文档中的书签(bookmark),可以在指定的书签位置插入文本或图片内容。该类通过解析Word文档的XML结构和相关文件,定位书签位置,并根据提供的内容字典插入所需内容。......
阅读量:797 次
2023-03-23
09-smart_bookmark_filler.py
classDocxImageInserter:def__init__(self,docx_path):self.docx_path=docx_pathself.temp_dir='temp_docx'self.namespaces={'w':'http://schemas.openxmlformats.org/wordprocessingml/2006/main','wp':'http://sch......
阅读量:797 次
2023-03-23
07-read_specific_rows_columns
使用openpyxl优化查询Excel数据处理在处理Excel数据时,为了更高效地读取特定范围内的数据,可以使用openpyxl库中的iter_rows方法来限制读取的行和列范围。以下是具体实现方式和详细说明:代码示例fromopenpyxlimportload_workbookfile_path=r'C:\Leon\python_project\oceanxecm\2025\04\2025041......
阅读量:797 次
2023-03-23
05-faiss_chinese_path_query
使用FAISS和LangChain构建RAG管道引言在自然语言处理领域,检索增强生成(Retrieval-AugmentedGeneration,RAG)是一项强大的技术,能够通过结合检索和生成模型,显著提升问题回答的质量。本文将介绍一个基于FAISS向量库和LangChain框架构建的RAG管道的实现方法。模型引入首先,我们需要引入必要的外部库:fromlangchain_community.v......
阅读量:799 次
2023-03-23
05-faiss_chinese_path_query
基于向量存储的问答系统实现本文将详细介绍如何构建一个基于向量存储的问答系统,结合FAISS向量索引和Ollama嵌入模型,实现检索增强生成(RAG)管道的构建与应用。第一部分:向量存储的加载代码核心组件包括FAISS向量库的加载与配置。在实际应用中,我们需要确保以下几点:确保FAISS向量库的存在与有效性配置Ollama嵌入模型的服务地址初始化向量索引的检索参数代码实现如下:fromlangcha......
阅读量:798 次
2023-03-23
05-bid_document_generator
importrequestsimportjsonimportreimportosimportpandasaspdfrompaddleocrimportPaddleOCRfrompdf2imageimportconvert_from_pathimportshutilimporttimefromtypingimportOptional,Tuple,ListfromdocximportDocumentf......
阅读量:798 次
2023-03-23
ActionContext和ServletActionContext小结
在Struts2开发中,除了将请求参数自动设置到Action的字段中,我们还需要在Action中直接获取请求(Request)或会话(Session)的一些信息,甚至需要对JavaServletHttp的请求(HttpServletRequest)和响应(HttpServletResponse)进行操作。以下是获取request、response和session的详细说明。1.ActionCont......
阅读量:798 次
2023-03-23
04-paddleocr_keyword_marker
使用PaddleOCR进行图片文字识别与关键词定位的实用解决方案本文将详细介绍如何利用PaddleOCR进行图片文字识别,并通过关键词定位实现自动化的图片标记与处理任务。我们将从OCR模型的初始化、关键词匹配的逻辑设计,以及最终的图片标记与保存环节,全面阐述实现过程。1.OCR模型的初始化在实际应用中,首先需要初始化PaddleOCR模型,并选择合适的语言模型。以下是具体的实现代码:frompad......
阅读量:800 次
2023-03-23
04-faiss_chinese_path_content_rag
<html><div></div><head></head><div></div><body><div></div><pre>从langchain.document_loaders导入相关加载器,根据文件格式选择合适的文档加载器进行文件加载。文件分块采用langcha......
阅读量:799 次
2023-03-23
20145328 《Java程序设计》第0周学习总结
《Java程序设计》第0周学习总结作为一名软件工程专业的学习者,我最近阅读了三篇关于师生关系、学习方法和专业教育的文章。这些文章不仅深刻地展现了教育的本质,也为我的学习提供了许多启发。首先,文章中关于师生关系的讨论让我想到了韩愈的《师说》。在古文中,师者“传道受业解惑”,这让我深刻理解了师生关系的重要性。作为学生,面对知识的海洋,何尝不是“惑而不从师,其为惑也,终不解矣”?真正的学习需要主动向老师......
阅读量:809 次
2023-03-23
C++ - Vector 计算 均值(mean) 和 方差(variance)
Vector计算均值(mean)和方差(variance)本文地址已移除vector<>类型的数组,计算均值和方差的最简方法代码示例:计算均值:doublesum=std::accumulate(std::begin(resultSet),std::end(resultSet),0.0);doublemean=sum/resultSet.size();//均值计算方差:doubleac......
阅读量:808 次
2023-03-23
02-deepseek_nomic_knowledge_base
<html><head></head><body><div></div><pre>加载并分块文档从代码中可以看到,主要完成以下功能:加载文档文件并将其分块为多个文本段落。支持PDF、Word文档和文本文件的加载,分别使用对应的文档加载器进行处理。文档加载器的选择根据文件扩展名自动确定:-.pdf文件使用PyPDFL......
阅读量:807 次
2023-03-23
01背包问题(回溯法实现,java)
上两天学习的回溯算法,老师让我们用回溯法来解决01背包问题。经过几天的修改和完善,最终实现了成功的解决方案。回溯算法是一种典型的后序搜索方法,它的思路是从目标往回走,一步步尝试不同的选择。对于01背包问题,这意味着我们需要从物品的价值和重量入手,每次尝试选择一个物品,如果当前的重量和价值能够满足背包容量的要求,就记录下来并继续深入下一个子树;如果不行,就回溯并尝试另一个可能的选择。在代码实现中,我......
阅读量:800 次
2023-03-23
367. 有效的完全平方数
判断一个数是否为平方数的多种方法<divclass="method-section"><h2>1.暴力搜索法</h2><p>这种方法通过暴力检查每个数是否为平方数,时间复杂度为O(√n)。具体实现如下:</p><pre><codeclass="language-python"&gt......
阅读量:800 次
2023-03-23
01-document_qa_with_nomic_embed_text
如何构建一个基于RAG的问答系统引言随着人工智能技术的不断发展,问答系统的构建已经成为一种高效的解决方案。通过结合检索技术和生成技术(Retrieval-AugmentedGeneration,RAG),我们能够构建一个能够理解并回答复杂问题的系统。本文将详细介绍如何构建一个基于RAG的问答系统。1.加载和分块文档在构建问答系统之前,我们需要准备好文档数据。首先,我们需要从文件中加载文档内容,然后......
阅读量:796 次
2023-03-23
--tls_version=“TLSv1.2,TLSv1.3“
在MySQL配置中,--tls_version="TLSv1.2,TLSv1.3"是一个启动参数,用于指定MySQL服务器支持的TLS(TransportLayerSecurity,传输层安全协议)版本。TLS是一种加密协议,用于在客户端和服务器之间建立安全的通信通道,确保数据在传输过程中不被窃听或篡改。TLS版本详解TLS协议经历了多个版本的演进,每个版本都在安全性和性能上有......
阅读量:796 次
2023-03-23
- ELASTIC_PASSWORD=${ELASTIC_PASSWORD}
Elasticsearch的安全密码配置指南在Elasticsearch集群中,密码的安全配置至关重要。本文将详细说明如何通过环境变量设置Elasticsearch的内置超级用户密码,并确保集群的安全性。环境变量的作用ELASTIC_PASSWORD是Elasticsearch的预定义环境变量,其主要作用是设置内置超级用户“elastic”的密码。默认情况下,Elasticsearch启用了强大的......
阅读量:796 次
2023-03-23
(转载)分布式锁的多种实现方式
分布式锁是解决分布式系统中共享资源一致性问题的重要机制。在单机环境下,线程锁机制可以有效地保证资源的互斥性,但在分布式系统中,由于资源可能分布在多个节点上,传统的线程锁机制失效了。因此,我们需要引入分布式锁来实现资源的互斥。为什么需要分布式锁?在单机系统中,多个线程可能同时访问共享资源,线程锁机制可以有效地避免数据不一致的问题。但在分布式系统中,资源可能分布在不同的节点上,传统的线程锁机制已经无法......
阅读量:796 次
2023-03-23
(转载)关于分布式事务、两阶段提交协议、三阶提交协议
随着大型网站的高并发访问和海量数据处理需求日益增加,如何实现网站的高可用、易伸缩、可扩展以及安全等目标显得尤为重要。为了解决分布式系统中的一致性问题,本文将介绍分布式事务、XA规范、两阶段提交(2PC)和三阶段提交(3PC)。分布式一致性回顾在分布式系统中,数据的高可用性依赖于多副本的存储,这些副本分布在不同的物理机器上。为了确保用户对数据操作的语义一致性,这些副本必须保持一致。为了解决这一问题,......
阅读量:796 次
2023-03-23