跳转到内容
彼岸论坛

小天管理

管理员
  • 内容数

    16401
  • 注册日期

  • 最后上线

  • 得奖次数

    2

小天管理 发表的所有内容

  1. 度个假,颓废游,在酒店里躺一周。
  2. Fork 一个开源项目二次开发,但是新增的功能与原始项目关联不大,不能直接提 PR ,在这种情况下,如何在原始项目提交新代码时,若没有冲突,就自动同步提交到自己的 Fork 项目? 这种情况各位有没有经验?
  3. 最近打算买个便宜笔记本干点自己电脑不方便干的活。性能要求不高,赛扬 N4000 应该也能应付。 处理器用的赛扬 N4000,8+128 的 ¥ 640 ,16+256 的 ¥ 800 。这个价格靠谱吗,哪个配置性价比好点? 160 块钱换 8G 内存 + 128G 固态合适吗?如果是买 8+128 我估计买回来还得自己加个小点的硬盘。
  4. 需求: 1 、支持实体双卡和 Esim 卡功能 2 、日常双待:有时实体卡 1+Esim ,有时双实体卡 3 、千元多,备用机。
  5. 前几天滴滴打个快车下车后准备付钱,发现支付状态显示“亲友已支付”,当场就懵了,我没任何印象开通过亲友代付,甚至不知道滴滴还有这功能,页面也找不到是谁帮我代付的,于是联系客服,找到了功能入口,页面显示有两个手机号为我开通了支付宝免密代付,都是我老婆的,当时我老婆就在旁边,她的反应和我一样懵。。。完全不知道有这个东西,而且就算开通,不太可能两个手机号都开通(其中一个手机号是几乎不用的备用号) 一通追问,客服说是 2020 年 12 月份开通的。。。 可能确实时间太久远是我忘记了, 就问客服怎么关闭,客服告诉我怎么点怎么点。。 神奇的事情来了,我切回滴滴 APP 准备按照客服说的方式关闭,发现几秒前都还在的两个代付授权信息全消失了。。。 我问客服怎么回事,客服跟我扯什么网络问题、手机缓存,让我退出页面重试,我都把 APP 卸载重装了还是看不到此前的授权信息 后面客服说他们内部排查下这个问题,第二天客服来电话了,给了一个让我很无语的答复: 客服:“您的亲友代付现在是处于关闭状态的” 我:“谁关闭的?我都没操作过,谁给我关闭的” 客服:“我们查询结果就是关闭的,谁操作关闭的话,这个我们查询不到” 我:“这不是扯么,你们能查到是我自己开通的, 怎么查不到谁关闭的?? 什么时间关闭的?” 客服:“什么时间关闭的也查不到” 我:“。。。” 我:“你们不用扯什么查不到来搪塞我,我也是搞技术的,不存在查不到,你们是不是做了什么操作不方便告知??” 后面就是我一通贴脸输出了, 客服反正就是不承认他们有问题,也不正面回应我的问题,死猪不怕开水烫的态度 后来又在互联网信息服务投诉平台投诉了,等来的电话和之前一样,不承认也不正面回应。。。 我现在有理由怀疑是不是代付开通也不是我本人操作的,代付金额 10 块钱是小事,但这操作证明滴滴在随意滥用我的联系人信息、支付授权信息。。非常恶心😡 而且他们一副死猪态度,投诉无门,更恶心了
  6. rt 目前没接受,让按工资来算。不知道这个是否合法?能不能争取 「第四十七条 经济补偿按劳动者在本单位工作的年限,每满一年支付一个月工资的标准向劳动者支付。六个月以上不满一年的,按一年计算;不满六个月的,向劳动者支付半个月工资的经济补偿。   劳动者月工资高于用人单位所在直辖市、设区的市级人民政府公布的本地区上年度职工月平均工资三倍的,向其支付经济补偿的标准按职工月平均工资三倍的数额支付,向其支付经济补偿的年限最高不超过十二年」劳动合同法里写的是「上年度职工月平均工资三倍」但是 hr 那边给的是「 2023 年杭州市单位就业人员年平均工资统计公报」 这个统计公报能替代劳动合同法中提的「上年度职工收入」?
  7. 谢谢大家,看看 v 上有没有类似经历的朋友 需求:隐形正畸,隐适美或者时代天使 问题 1:在北京,隐适美或者时代天使大概价格是什么样的 问题 2:应该去北大口腔/北京口腔这类三甲专业口腔医院还是类似瑞尔 瑞泰私立口腔,他们说医生的方案很重要,目前是打算找专业口腔医院正畸科大夫 问题 3:其他有没有什么注意的问题
  8. 乘着苹果教育优惠活动,给自己换了 MacbookPro ,想问问 v 友们,有没有好用的软件/工具推荐一下,比如写文章、记笔记、做图、ppt 等...
  9. 先放个链接: https://github.com/lazyFrogLOL/llmdocparser 目前有很多方案用于 RAG 的 text chunking 部分,例如最著名的就是 Langchain 项目中集成的 Unstructure。 Unstructure 的优势在于,集成了一整套 OCR 、版面分析等方案,输出丰富的 text chunks 。不过它没法解决文档中图片、图表的解析。 然后最近有一个比较火的项目,gptpdf,它使用 PyMuPDF 对 pdf 的版面进行解析,通过设定一定规则,合并文本区域,并且标注出图片图表区域,将这些统统扔给 GPT-4o 或者 Qwen-VL 这样的多模态模型识别,生成一个完整的 markdown 格式文档。 这个项目特别简洁,一共就不到 300 行代码。 我读完后,觉得目前目标是直接构建能够用于 RAG 索引的 text chunks 。那么是否最后输出 markdown 其实也没那么重要。于是在它的思路上又做了一些改造,形成了一套新的 PDF 解析方案llmdocparser。 下面我来介绍一下整个方案。 流程介绍 首先,我们仍然需要进行版面分析,gptpdf 使用了规则进行版面分析,我这里用的是 paddleocr 的 PPStructure 模型, 它的解析能够生成每一页各个区域的类别、位置及阅读顺序信息,示例如下, [{'header': ((101, 66, 436, 102), 0)}, {'header': ((1038, 81, 1088, 95), 1)}, {'title': ((106, 215, 947, 284), 2)}, {'text': ((101, 319, 835, 390), 3)}, {'text': ((100, 565, 579, 933), 4)}, {'text': ((100, 967, 573, 1025), 5)}, {'text': ((121, 1055, 276, 1091), 6)}, {'reference': ((101, 1124, 562, 1429), 7)}, {'text': ((610, 565, 1089, 930), 8)}, {'text': ((613, 976, 1006, 1045), 9)}, {'title': ((612, 1114, 726, 1129), 10)}, {'text': ((611, 1165, 1089, 1431), 11)}, {'title': ((1011, 1471, 1084, 1492), 12)}] 基于这个信息,能够设定丰富一些的规则,来进行区域的合并。例如下图是一个版面分析的结果: 基于一些现实的情况,我们可以设置让重叠的区域合并,title 类型和接下来的一个 text 类型的区域合并等。 合并完成后,更新了区域的位置,然后将每个区域保存成图片,以供后续大模型解析。 当然,这里其实有挺多种状况值得处理,例如版面分析时,有些图片没有被定位到。这里就仍然需要使用 PyMuPDF 也解析一遍页面,获取它的解析结果。然后和模型解析的结果进行对比,补充未被识别的区域。 最后,所有的图片将一一传送给多模态大模型进行解析,形成一个 text chunks 表格: | filepath | type | page_no | filename | content | |-------------------------------------------|-----------------|---------|---------------------------|-----------------------| | output/page_1_title.png | Title | 1 | attention is all you need | [Text Block 1] | | output/page_1_text.png | Text | 1 | attention is all you need | [Text Block 2] | | output/page_2_figure.png | Figure | 2 | attention is all you need | [Text Block 3] | | output/page_2_figure_caption.png | Figure caption | 2 | attention is all you need | [Text Block 4] | | output/page_3_table.png | Table | 3 | attention is all you need | [Text Block 5] | | output/page_3_table_caption.png | Table caption | 3 | attention is all you need | [Text Block 6] | | output/page_1_header.png | Header | 1 | attention is all you need | [Text Block 7] | | output/page_2_footer.png | Footer | 2 | attention is all you need | [Text Block 8] | | output/page_3_reference.png | Reference | 3 | attention is all you need | [Text Block 9] | | output/page_1_equation.png | Equation | 1 | attention is all you need | [Text Block 10] | 这个表格中包含了,区域截图的位置、类型、页码,文件名以及对应解析出来的文本块。 后续这个用法就比较丰富了,假如是图片类型的文本块被检索到,则可以在回答中返回这个截图的位置,前端进行渲染后,生成图文并茂的回答。 总结 具体的用法可参加项目的 README 文档,特别简单, Installation pip install llmdocparser Usage from llmdocparser.llm_parser import get_image_content content = get_image_content( llm_type="azure", pdf_path="path/to/your/pdf", output_dir="path/to/output/directory", max_concurrency=5, azure_deployment="azure-gpt-4o", azure_endpoint="your_azure_endpoint", api_key="your_api_key", api_version="your_api_version" ) print(content) 这里需要注意的是,项目支持 Azure 、OpenAI 、DashScope 三种服务商,llm_type 如果是 azure 的话,则需要传入 azure_deployment 和 azure_endpoint 参数。 假如是调用兼容 OpenAI 接口格式的 API ,则传入 base_url 和 api_key 即可。 这个项目也并不复杂,如果有疑问,可以提个 issue 。
  10. 如题,想要用不同版本的 b 站
  11. 行为审计 职责: 1 、对主机资产进行人工或工具辅助方式的安全审计(日志,流量)。 2 、透过审计,能发现潜在的安全风险。同时通过对关键资产操作配置行为的审计,安全部门可以及时了解现有资产的相关状态,便于后续安全策略的跟进实施。 要求: 1 、熟 Linux, cdn, waf, aliyun, gcp, aws 。 2 、管理过 k8s, docker, Prometheus, graylog 。 3 、能够分析从日志系统分析出安全风险。 4 、能主动跟进新的安全事件。 安全运维 职责: 1 、对公司生产环境及 OA 环境进行安全加固,并定期进行巡检; 2 、对生产环境 OS 、服务、数据库等软件版本进行基线测试和安全加固; 3 、安全事件排查与分析,配合定期编写安全分析报告,专注业内安全事件; 4 、跟踪最新漏洞信息,进行业务产品的安全检查; 5 、负责信息安全策略/流程的制定,安全培训/宣传及推广; 6 、负责相关系统漏洞修复工作推进,跟踪解决情况,问题收集; 7 、负责系统安全监控和应急响应。 8 、需轮值班处理工作任务。 要求: 1 、熟悉主流的 Web 安全技术,包括 SQL 注入、XSS 、CSRF 等 OWASP TOP 10 安全风险; 2 、熟悉 Linux/Windows 下系统和软件的安全配置与加固; 3 、熟悉常见的安全产品及原理,例如 IDS 、IPS 、防火墙等; 4 、熟悉常见监控、日志系统的架构、原理及维护,如 Grafana 、Prometheus 、Wazuh 、Graylog 、ELK 、Zabbix 等; 5 、熟悉常见 VPN 、应用代理的基本原理、部署及维护,如 OpenVPN 、IpSec 、WireGuard 、Trojan 、Shadowsocks 等 6 、掌握常见系统、应用的日志分析方法及具有安全事件挖掘、调查取证经验 7 、掌握 Go/Python/Shell 等 1 或多种语言; 8 、网络基础扎实,熟悉 TCP/IP 协议,二层转发和三层路由的原理,动态路由协议,常用的应用层协议; 9 、具有较强的问题综合分析和解决能力,较强心理素质及独立工作能力,具备良好团队合作能力, 较好的文档撰写能力及较好的沟通表达能力 10 、熟悉 Kubernetes ,等 Cloud-native 常见架构和技术,与云原生安全议题。 11 、熟悉 AWS, GCP, ALIYUN, Azure 等云端厂商服务。 12 、具有三年以上,应急响应安全事件处理经验。 *必须符合岗位要求 工作时间:8 小时左右 地点:居家远程 薪资:20-35k+绩效
  12. 道听途说地了解到知乎整体内容质量大不如前,但尚能屎里淘金。前段时间虽然知乎屏蔽了 Bing 的爬虫还使用乱码干扰,但点进去的内容也符合检索的关键词。前几天朋友发来一个知乎链接,用手机点进去发现阅读全文必须登录,电脑亦然,明明前一段时间还不用。电子洁癖患者自然选择一笑了之,不看了。 技术问题还可以 Bing 或者 Google 一下,查询办事章程等就只能搜到 XX 新闻的过时信息。微信公众号文章尚能用搜狗,微博不登录也能搜几条,贴吧偶尔能搜到有用的,小红书那是连网页版都没有,居然就剩抖音最开放?!每个巨头都在圈地,都有各自的局域网,圈内互联,圈外失联。 唉~电子洁癖不友好型。是病,得治。
  13. 想家用存存电影资源,但是对 NAS 不了解,目前 1k 出头的价位好像除了 QNAS 就是天钡 wrt pro ( n100 款)?两者的价钱好像差不多,但是我对 QNAS 的硬件不太了解。 PS:天钡最近还出了 wrt pro ( 5825U 款),我看也没什么讨论,5825U 据说比 n100 的性能强 3 倍,但价钱已经到 1899 ,普通家用应该不需要这么高的性能
  14. 做了一个简单的,图文封面设计工具,欢迎大家体验点评 工具: https://www.ubrand.com/ai-social-post 基本逻辑:输入主题。或者上传一张图片,即可生成对应的图片。 特点:模板简洁,基本是社交平台上好看、清爽干净的图文排版设计; 操作简单,免费使用。
  15. 从国内大厂裁员出来,目前 3 份 Offer ,一份 offer 待最终面但是前几个比较急。 原工作税前 345k 。 公司一,国内某工业大厂,已拿 offer ,月薪 26k ,13 薪,加上其它补贴约等于上份工作的税前,公积金最低档。隔壁市,房价相比很便宜月薪>房价均价每平米,可以周末坐火车来回,号称不怎么加班的 975 ,但是看员工评论加班比较严重。 公司二,某外资背景的创业公司,工业方向的小厂,已拿 offer ,月薪 26k ,13 薪,且给目前估值 10w rmb 的美国本部公司的股票,公积金最低档,号称 975 不加班,离家单程 2 小时过去要租房,公司规模很小大概只有几十人的团队,融资 B 轮。不清楚实际加班情况。 公司三,国内大国企,互联网方向,已拿 offer ,月薪到手 12k ,非工资类福利补贴一年约 30k ,年终奖约 80k ,公积金最高档,五险二金,965 除了上线几乎不加班(有证实),公司内高龄人员众多,面试时说明不裁员,但是超过一定年龄后不会给升职机会,离家可以坐地铁单程 60 分钟。 公司四,国内大国企,金融方向,等待最终面,月薪 15k ,20 薪,上班 965 ,公积金最高档。面试时说明会加班到 8-9 点,离家可以坐地铁单程 40 分钟。 各位会选哪个呢?觉得哪个更合适?
  16. 忘了在哪本书上看到的例子: package main import "fmt" func main() { // 不指定类型时为浮点数 var a = 2e3 fmt.Printf("%T: %v\n", a, a) // 输出:float64: 2000 // 编译成功,因为 1.5e3 等于 1500 ,是一个整数 var b int = 1.5e3 fmt.Printf("%T: %v\n", b, b) // 输出:int: 1500 } 上面代码中,为什么 var b int = 1.5e3 能通过编译,难道科学计数法被视为算术表达式或常量表达式?不然我只能认为 Go 语言存在隐式类型转换了。 有请知道的大佬解答原因,还有没有类似的情况呢?
  17. 昨晚撸了巴黎一个奥运会中央台的直播节目时间表,欢迎各位体育爱好者食用。 地址: https://2024.lingbaoboy.com
  18. 发现一个问题,很多翻译 Google YouTube Extenstion 所提供的翻译字幕不准确,如 AI Subtitles & Immersive Translate - Trancy 和 Language Reactor 提供的翻译都不太准确。 用这两个拓展翻译都不太准确。所以想找英文 Native Speaker 带有中文字幕并且具有批判性思维和分析思维的非营利独立新闻媒体 YouTube 频道。 急需养成 Think in English,但发现这两 Extenstion 在翻译带有英文字幕(非系统自动翻译的字幕)的视频时,它们都不能较准确的翻译。
  19. 目前跟女友两人在沈阳,打算换工作。女友是产品,我是后端,都是 1~3 年,想赚点钱,请问哪个城市好一点呀。
  20. 手持一加 12 ,coloros ,装了个第三方启动器,每次打开新应用都要确认,而装的天气通,随便误触了一下,直接跳微信小程序,关都关不掉。正常用,要你各种权限,要推广告了,一路绿灯。就离谱
×
×
  • 创建新的...