端到端的智能问答系统
一个完整的端到端智能问答系统应该包含哪些环节? 一个完整的基于 LLM 的端到端问答系统,应该包括用户输入检验、问题分流、模型响应、回答质量评估、Prompt 迭代、回归测试,随着规模增大,围绕 Prompt 的版本管理、自动化测试和安全防护也是重要的话题,部分代码参考自吴恩达老师《Building Systems with the ChatGPT API》课程。 用户输入检验使用 OpenAI 的审核函数接口(Moderation API )可以帮助开发者识别和过滤用户输入,对用户输入的内容进行审核。 性(Sexual):包括引起性兴奋的内容,例如性活动的描写,或者推广性服务,但不包括性教育和健康方面的内容。 仇恨(Hate):包括表达、煽动或宣扬基于种族、性别、民族、宗教、国籍、性取向、残疾状况或种姓的仇恨情感的内容。 自残(Self-harm):包括宣扬、鼓励或描绘自残行为(例如自杀、割伤和饮食失调)的内容。 暴力(Violence):包括宣扬或美化暴力行为,或者歌颂他人遭受苦难或羞辱的内容。 import openai import pandas as...
LLM安全专题
LLM 安全专题提示词 是指在训练或与大型语言模型(Claude,ChatGPT等)进行交互时,提供给模型的输入文本。通过给定特定的 提示词,可以引导模型生成特定主题或类型的文本。在自然语言处理(NLP)任务中,提示词充当了问题或输入的角色,而模型的输出是对这个问题的回答或完成的任务。 关于怎样设计好的 Prompt,查看Prompt专题章节内容就可以了,我不在这里过多阐述,个人比较感兴趣针对 Prompt的攻击,随着大语言模型的广泛应用,安全必定是一个非常值得关注的领域。 提示攻击提示攻击是一种利用 LLM...
OpenAI 文档解读
OpenAI 文档解读OpenAI 文档涉及内容众多,而且这里已经有了中文翻译,需要详细了解的可以自行前往阅读。我这里会重点选取高频使用的 API 进行说明以及对GPT最佳实践主题进行解读。 这篇文章中个人结合自己的实践经验把 OpenAI 官方文档解读一遍。但是原文档涉及内容众多,包括微调,嵌入(Embeddings)等众多主题,我这里重点挑选自己开发高频使用到的,需要详细了解的可以自行前往官网阅读。 API介绍 所有 API 演示均使用 Python 代码作为示例,所以确保已经安装官方 Python 包:pip install openai,同时配置 API 密钥的环境变量 OPENAI_API_KEY。 认证:OpenAI API 使用 API 密钥进行身份验证, API密钥页面可以获取使用的 API 密钥。除了密钥,对于属于多个组织的用户,可以传递一个Requesting organization字段(可以在组织设置页面上找到组织ID)来指定用于 API请求的组织,这些API请求的使用将计入指定组织的订阅配额。 import os import openai #...
LLMOops
LLMOps 介绍LLMOps 是什么?我认为是 MLOps 的一个子类别,LLMOps 关注的是调整现有基础大型语言模型所需的运营能力和基础设施,并将这些优化后的大模型部署为产品的一部分。 下面这篇文章译自微软技术社区 An Introduction to LLMOps: Operationalizing and Managing Large Language Models using Azure ML,虽说微软肯定是顺便推广自己家机器学习托管服务的,但是文章质量肯定没问题,对一些概念的澄清也是专业的,故将原文翻译如下。广义上的 LLMOps 包括大模型训练、推理和部署工具。 介绍近几个月来,随着 GPT-4 等大规模语言模型的出现,自然语言处理 (NLP) 领域发生了范式转变。这些模型由于能够捕捉和理解人类语言的复杂性,在各种 NLP 任务中取得了卓越的性能。然而,为了充分释放这些预训练模型的潜力,必须简化这些模型在实际应用中的部署和管理。 在这篇文章将探讨大型语言模型的操作过程,包括提示工程和调整、微调和部署,以及与这种新范式相关的好处和挑战。 LLM...
五元组流的流级别特征提取、报文级时间序列特征提取
五元组流的流级别特征提取自动化安装Zeek脚本 Zeek安装步骤较多,因此我整理了所有步骤后,编写了自动化安装脚本,直接运行即可 sudo ./zeek_one_install.sh #!/bin/sh # Time: 08/02/2024 # Author: h3110w0r1d sheng_yakun@163.com repo=https://github.com/zeek/zeek.git dependency=(wget flex bison swig libpcap-devel openssl-devel zlib-devel python-devel gerpftools kernel-headers) reliance_list=(https://cmake.org/files/v3.6/cmake-3.6.2.tar.gz ) zeekgit=$(basename ${repo}) zeekdir=${zeekgit%%.git*} # install dependencies sudo...
Suricata通过共享内存获取流量+pwn-浏览器内核V8
Suricata通过共享内存获取流量IntroductionSuricata是一个高性能的网络入侵检测和防御系统(IDS/IPS)。它是由OISF开发,完全开源,并且可以免费使用。https://github.com/OISF/suricata Suricata由线程和队列组成,数据包在线程间传递通过队列实现。线程由多个线程模块组成,每个线程模块实现一种功能。 Suricata有多种运行模式,这些模式与抓包驱动和IDS/IPS选择相关联。抓包驱动如:pcap, pcap file, nfqueue, ipfw, dpdk或者一个特有的抓包驱动等。Suricata在启动时只能选择某个运行模式。如-i选项表示pcap,-r表示pcapfile,-q表示nfqueue等。每一种运行模式都会初始化一些threads, queues等。模式的具体任务是由线程模块来完成。根据线程和线程模块的组织方式的不同,我们可以./suricata –list-runmodes查看运行模式,运行模式又细分为”autofp”, “single”,“wokers”。 Suricata...
云原生实战-Docker+K8s
云平台核心公有云 公有云资源(服务器、存储空间)由第三方云服务商运营 通过Internet提供 在公有云中,与其它组织或云“用户” 共享相同的硬件、存储和网络设备 优势:近乎无限性的缩放性,提供按需资源,可满足业务需求 私有云 私有云由专供一个企业或组织使用的云计算资源构成 服务和基础结构始终在私有网络上进行维护 私有云使用对象:政府机构、金融机构、具备业务关键性运营且希望对环境拥有更大控制权的大型组织 更高的隐私级别 基础概念 云服务器作为应用的最终载体 VPC为所有的云服务器提供网络隔离:在物理层做网络隔离 安全组控制每个服务器的防火规则 公网IP使得资源可访问 端口转发的方式访问到具体服务器 什么是VPC VPC: virtual private cloud,虚拟私有云,用户在公共云上申请的隔离的、私密的虚拟网络环境 用户可以自由配置VPC内的IP地址段、子网、安全组等子服务,也可以申请弹性带宽和弹性IP搭建业务服务 ...
计算机网络复习
第一章计算机网络组成 硬件、软件、协议 网络适配器/网卡:用于通信的芯片,将主机数据发送到网络上,接收来自网络的数据 网络、互联网、因特网 网络是由若干节点和链接这些节点的链路组成 internet:通用名词,泛指多个计算机网络互联而成的网络 Internet:专用名词,当前全球最大的、开放的,由众多网络相互连接而成的特定计算机网络 因特网服务提供者:Internet Service Provider,因特网上的主机必须有IP地址才能通信,电信、联通、移动 三种交换方式###电路交换 两两通信节点之间需要一根链路,共需要(n-1)*n/2 后采用电路交换机,每一部电话都连接到电话交换机上,有多个开关的开关器 电话交换机连通电话线的方法称为电路交换 从通信资源分配的角度来看,交换是按照某种方式动态分配传输线路的资源 电路交换的三个步骤: 1. 建立连接:分配通信资源 2. 通话:一直占用通信资源 3. 释放连接:归还通信资源 分组交换 计算机网络一般采用分组交换 ...
Metasploit实战
Metasploit实战靶机选择 本次我选择的是Download Metasploitable (sourceforge.net) Metasploitable靶机 使用vmware进行挂载 渗透测试过程信息搜集 因为使用vmware在本地进行挂载,所以需要先找到目标靶机的IP 先在kali中使用ifconfig查找到eth0的IP地址 对该地址进行C端地址扫描,nmap -sP 查找存活主机 nmap -sP 因为kali是134,目标靶机是在kali开启后进行挂载的,可以直接判断为地址要大于134 对剩余的地址进行nmap -sV,查看目标靶机开启的服务 nmap -sV 看到有Samba smbd 3.X - 4.X服务在运行,SMB是在局域网上共享文件和打印机的通信协议,在局域网内使用Linux和Windows系统的机器之间提供文件和打印机等资源的共享服务 漏洞利用 进入msf,使用如下命令进行Samba漏洞利用模块的扫描 seasearch samba ...