您的浏览器禁用了JavaScript(一种计算机语言,用以实现您与网页的交互),请解除该禁用,或者联系我们。 [北京航空航天大学&清华大学]:《让科研像聊天一样简单》——77个数据科研提示词 - 发现报告

《让科研像聊天一样简单》——77个数据科研提示词

报告封面

北京航空航天大学人文与社会科学高等研究院清华大学新闻与传播学院、人工智能学院双聘教授@新媒沈阳团队何静(副教授) (软件和课件将持续更新,敬请期待) 数据清洗--缺失值处理 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中 的【 变 量/列 名 】进 行 缺失 值 分 析 , 并 采 用【 填 补 方 法 ( 如 均 值 、 中 位 数 、 插 值 、删 除 ) 】处 理 缺 失 值 , 输 出 处 理 后 的完 整 数 据 及 处 理 情 况说 明 。 示例 数据清洗--异常值检测与修正 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 对【 变 量/列 名 】进 行 异常 值 检 测 , 使 用【 检 测 方 法 ( 如Z - s c o r e、I Q R、 箱 线 图 法 、孤 立 森 林 ) 】, 并 根 据【 修 正 方 式 ( 如 删 除 、 替 换 、 截 断 ) 】输 出 修 正 后 的完 整 数 据 和 异 常 值 报 告 。 示例 数据清洗--噪声处理 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】的【 变 量/列 名 】进 行 噪 声 检测 与 处 理 , 采 用【 方 法 ( 如 平 滑 、 移 动 平 均 、 滤 波 、 小 波 变换 ) 】, 输 出 处 理 前 后 对 比 与 噪 声 抑 制 效 果 说 明,生 成 完 整 的处 理 后 数 据 表 。 示例 数据清洗--重复值去除 提 示 词 公 式 请 检 查 数 据 集【 数 据 名 称/路 径 】中 的 重 复 记 录 , 按【 字 段/唯 一 标 识 】判 断 重 复 , 并 执 行【 去 除 方 式 ( 如 保 留 第 一 条 、保 留 最 后 一 条 、 合 并 ) 】, 输 出 清 理 后 的完 整 数 据 和 重 复 情况 统 计 。 示例 数据转换--标准化/归一化 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中 的【 变 量/列 名 】进 行 标 准化/归 一 化 处 理 , 使 用【 方 法 ( 如Z - s c o r e标 准 化 、M i n -M a x归 一 化 、 对 数 转 换 ) 】, 输 出 转 换 后 的完 整 数 据 和 转 换公 式 。 示例 数据转换--单位与量纲转换 提 示 词 公 式 请 将 数 据 集【 数 据 名 称/路 径 】中【 变 量/列 名 】的 单 位 从【 原 单 位 】转 换 为【 目 标 单 位 】, 并 给 出 转 换 公 式 与 转 换 后的 完 整数 据 。 示例 数据转换--编码与解码 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中 的【 类 别 变 量/文 本 变 量 】进 行 编 码 , 使 用【 方 法 ( 如 独 热 编 码 、 标 签 编 码 、 目 标 编码 ) 】, 输 出 编 码 后 的完 整 结 果 与 对 应 的 映 射 关 系 。 示例 描述性统计--集中趋势分析 提 示 词 公 式 请 计 算 数 据 集【 数 据 名 称/路 径 】中【 变 量/列 名 】的 集中 趋 势 指 标 , 包 括 均 值 、 中 位 数 和 众 数 , 并 输 出 结 果 与简 要 解 释 。 示例 描述性统计--离散程度分析 提 示 词 公 式 请 计 算 数 据 集【 数 据 名 称/路 径 】中【 变 量/列 名 】的 离散 程 度 指 标 , 包 括 方 差 、 标 准 差 和 四 分 位 距 , 并 输 出 结果 与 波 动 性 说 明 。 示例 描述性统计--分布特征分析 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中【 变 量/列 名 】进 行 分布 特 征 分 析 , 计 算 偏 度 与 峰 度 指 标 , 并 解 释 该 变 量 的 分布 形 态 特 征 。 示例 模式与趋势发现--聚类趋势观察 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 基 于【 变 量/列 名 或全 部 变 量 】进 行 聚 类 趋 势 探 索 , 使 用【 方 法 ( 如K -m e a n s、 层 次 聚 类 ) 】, 输 出 聚 类 结 果 和 模 式 说 明 。 示例 模式与趋势发现--时间/空间规律识别 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中 的【 时 间/空 间 变 量 】进 行 规 律分 析 , 识 别 出【 趋 势 、 季 节 性 、 周 期 性 或 空 间 分 布 特 征 】, 并 输出 主 要 发 现 。 示例 模式与趋势发现--异常模式检测 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 对【 变 量/列 名 】进 行 异 常 模 式检 测 , 使 用【 方 法 ( 如 箱 线 图 阈 值 、Z - s c o r e、 聚 类 残 差 检测 ) 】, 输 出 异 常 点 位 置 及 异 常 模 式 特 征 。 示例 相关性分析--相关系数矩阵 提 示 词 公 式 请 计 算 数 据 集【 数 据 名 称/路 径 】中 各 变 量 之 间 的 相 关 系 数 矩 阵(P e a r s o n / S p e a r m a n) , 并 输 出 主 要 相 关 性 结 果 与 解 释 。 示例 相关性分析--偏相关分析 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 对【 目 标 变 量 】 和【 控 制 变 量 】进 行 偏 相 关 分 析 , 输 出 相 关 结 果并 解 释 控 制 变 量 对 关 系 的 影 响 。 示例 相关性分析--初步因果关系探索 提 示 词 公 式 请 基 于 数 据 集【 数 据 名 称/路 径 】中【 相 关 变 量 】, 进 行 初 步因 果 关 系 探 索 , 使 用【 方 法 ( 如 格 兰 杰 因 果 检 验 、 条 件 独 立性 检 验 ) 】, 并 输 出 可 能 的 因 果 方 向 提 示 。 示例 模型建立--线性/多元回归 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 以【 自 变 量 】为 解 释 变 量 , 【 因 变 量 】为 响 应 变 量 , 建 立 线 性/多 元 回 归 模 型 , 并 输 出 回归 系 数 、 显 著 性 检 验 结 果 和 模 型 拟 合 优 度 。 示例 模型建立--Logistic回归 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 以【 自 变 量 】为 解 释 变 量 ,【 二 分 类 因 变 量 】为 响 应 变 量 , 建 立L o g i s t i c回 归 模 型 , 并 输 出 回 归 系 数 、 显 著 性 检 验结 果 和 预 测 概 率 。 示例 模型建立--方差分析 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 对【 因 变 量 】进 行 单因 素/多 因 素 方 差 分 析 (A N O V A) , 分 组 变 量 为【 分 组变 量 】, 并 输 出 方 差 分 析 表 及 显 著 性 结 果 。 示例 假设检验--t检验 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中 的【 变 量/组 别 】进 行【t检 验 类 型 ( 单 样 本/双 样 本/配 对 样 本 ) 】, 并 输 出 检验 统 计 量 、p值 及 结 论 。 示例 假设检验--卡方检验 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 对【 分 类 变 量1】与 【 分 类 变 量2】进 行 卡 方 独 立 性 检 验 , 并 输 出 卡 方 统 计量 、p值 及 显 著 性 结 论 。 示例 假设检验--方差齐性检验 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中 的【 因 变 量 】在 不 同 【 分 组 变 量 】下 进 行 方 差 齐 性 检 验 , 并 输 出 检 验 统 计 量 、p值 及 是 否 满 足 方 差 齐 性 假 设 。 示例 假设检验--非参数检验 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中 的【 变 量/组 别 】进 行非 参 数 检 验 (【具 体 方 法 名 称 】) , 并 输 出 检 验 统 计 量 、p值 及 结 论 。 示例 参数估计--最大似然估计 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中【 变 量/列 名 】进 行 最 大 似 然 估 计 , 假 设 其 服 从【 分 布 类 型 】,输 出 参 数 估 计 值 及 对 比 拟 合 效 果 。 示例 参数估计--贝叶斯估计 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中【 变 量/列 名 】进 行 贝 叶 斯 估 计 ,设 定 先 验 分 布 为【 先 验 分 布 】, 输 出 后 验 分 布 参 数 及 估 计 结 果 。 示例 参数估计--区间估计与置信区间 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中【 变 量/列 名 】计 算 均 值 的 置 信区 间 , 置 信 水 平 设 为【 置 信 水 平 】, 并 输 出 区 间 范 围 及 解 释 。 示例 特征工程--特征选择 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 基 于【 方 法 ( 如 相 关 性 过滤 、 正 则 化 选 择 、 嵌 入 式 方 法 ) 】对【 变 量 范 围/特 征 集 合 】进 行 特 征 选 择 , 并 输 出 被 选 中 的 特 征 及 其 重 要 性 说 明 。 示例 特征工程--特征衍生 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 基 于【 已 有 变 量/列 名 】构 造 新 的 特 征 , 方 法 为【 方 式 ( 如 交 互 项 、 多 项 式 特 征 、 统计 特 征 提 取 ) 】, 并 输 出 新 特 征 及 生 成 逻 辑 。 示例 多变量分析--主成分分析 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 对【 变 量 范 围/特 征 集 合 】 进 行 主 成 分 分 析 (P C A) , 并 输 出 主 成 分 的 载 荷 矩 阵 、 解 释方 差 比 例 及 主 要 成 分 得 分 。 示例 多变量分析--判别分析 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 基 于【 分 组 变 量 】对【 特征 集 合 】进 行 线 性 判 别 分 析 (L D A) , 并 输 出 判 别 函 数 、 分类 结 果 及 模 型 准 确 率 。 示例 多变量分析--典型相关分析 提 示 词 公 式 请 在 数 据 集【 数 据 名 称/路 径 】中 , 对 变 量 集 合【X变 量 组 】 与【Y变 量 组 】进 行 典 型 相 关 分 析 (C C A) , 并 输 出 典 型 相 关系 数 及 显 著 性 检 验 结 果 。 示例 模型评估与检验--交叉验证 提 示 词 公 式 请 对 数 据 集【 数 据 名 称/路 径 】中 建 立 的【 模 型 名 称 】进 行K折 交 叉 验