统计建模基础

什么是建模? 问题——>数据——>模型——>结论 统计建模的本质 收集、分析、展示、解释数据 统计问题 回归: 横截面数据、纵向数据 分类: 横截面数据、分类数据 我们观测不到真值,观测到的数据一定有误差。 如何确定模型? 1.根据探索性数据分析主观确定一个参数模型或者一个算法。 2.根据已知数据训

统计文件个数

> 博客地址:https://www.cnblogs.com/zylyehuo/ # 完整版 ```python import os count = 0 # 遍历文件夹 def walkFile(file): for root, dirs, files in os.walk(file): # roo

大数据 - DWS层 业务实现

统计主题 需求指标【ADS】输出方式计算来源来源层级 访客【DWS】pv可视化大屏page_log 直接可求dwd UV(DAU)可视化大屏需要用 page_log 过滤去重dwm UJ 跳出率可视化大屏需要通过 page_log 行为判断dwm 进入页面数可视化大屏需要识别开始访问标识dwd 连续

统计力学中的概率论基础(二)

可以理解的是,概率密度函数,一般情况下都是连续的。但是对于采样或者随机试验来说,其实都是离散采样。大数定理通过取一个极限,将概率密度函数跟试验联系了起来。这篇文章主要介绍的是常用的几个概率密度函数的期望值和方差的计算,以及大数定理的基本概念。

统计力学中的概率论基础(一)

本文的主要内容是一些统计力学中的基础的概率论知识,如密度函数、分布函数和贝叶斯定理的一些基本概念,主要作为一个简单的知识内容记录和分享,后续还有更多的同系列文章。

地统计学的基本概念及公式详解

本文对插值、平稳假设、变异函数、克里格等常用的地学计算概念加以介绍,并对相关公式进行推导~

信奥一本通1187:统计字符数

1187:统计字符数 时间限制: 1000 ms 内存限制: 65536 KB 提交数:31962 通过数: 18310 【题目描述】 给定一个由a-z这26个字符组成的字符串,统计其中哪个字符出现的次数最多。 【输入】 输入包含一行,一个字符串,长度不超过1000。 【输出】 输出一行,包括出现次

SQLServer统计监控SQL执行计划突变的方法

使用动态管理视图(DMVs)来检测SQL执行计划的突变,你需要关注那些能够提供查询执行统计和计划信息的视图。以下是一些可以用于此目的的DMVs以及相应的查询示例: sys.dm_exec_query_stats:这个视图提供了关于SQL Server中查询执行的统计信息,包括CPU时间、总工作时间、

[转帖]linux 统计 TCP 网络连接状态

https://www.cnblogs.com/leffss/p/15471501.html 两种方法: awk 统计 $ ss -a|grep '^tcp'|awk '{ ++State[$2] } END { for (i in State) print i,State[i] }' LISTEN

[转帖]Linux统计/监控工具SAR详细介绍

原文链接: www.jiangxinlingdu.com Linux统计/监控工具SAR详细介绍:要判断一个系统瓶颈问题,有时需要几个 sar 命令选项结合起来使用,例如:怀疑CPU存在瓶颈,可用 sar -u 和 sar -q 等来查看 怀疑内存存在瓶颈,可用 sar -B、sar -r 和 sa

[转帖]TiDB 统计数据库占用大小的N种方法

TiDB之路2022-03-06 3896 前言 TiDB 如何统计数据库占用空间大小 四种方法 方法一 TiDB 统计数据库占用大小的第一种方法是监控。通过查看 {cluster-name} - Overview,可以查看Current storage size面板,获取当前集群已用数据库空间大小

[转帖]PostgreSQL 统计所有数据表各自的总行数

一般来说,可以使用 count(*) 来获取具体某张表的总行数: SELECT count(0) FROM t_user; 如果想获得所有表的行数信息,可以使用以下 SQL 语句: SELECT relname, reltuplesFROM pg_class CLS LEFT JOIN pg_nam

SPSS统计教程:卡方检验

本文简要的介绍了卡方分布、卡方概率密度函数和卡方检验,并通过SPSS实现了一个卡方检验例子,不仅对结果进行了解释,而且还给出了卡方、自由度和渐近显著性的计算过程。本文用到的数据"2.2.sav"链接为: https://url39.ctfile.com/f/2501739-875711187-f3d

百度统计--给博客园添加访问统计

全埋点、可视化圈选、API等多种方式采集数据 网站、APP、小程序等各端数据一站式管理 构建用户id体系,全面深度管理用户资产 https://tongji.baidu.com/web/welcome/login 添加网站 一般 20分钟后再查看是否生效。

项目中统计SQL执行缓慢的方案-数据预处理

使用场景: 由于表数据量巨大,导致一些统计相关的sql执行非常慢,使用户有非常不好的体验,并且sql和数据库已经没有优化空间了。(并且该统计信息数据实时性要求不高的前提下) 解决方案: 整体思路:创建预处理表——通过定时任务将数据插入到结果表——统计信息时直接通过结果表进行查询——大大提高响应速度

[快速阅读六] 统计内存数据中二进制1的个数(SSE指令集优化版).

介绍了在不同指令集环境下(SSE4\SSE3\SSE2)统计二进制中1的个数的优化,其优化速度较最原始版本的有近80倍提高。

用python字典统计CSV数据

1.用python字典统计CSV数据的步骤和代码示例 为了使用Python字典来统计CSV数据,我们可以使用内置的csv模块来读取CSV文件,并使用字典来存储统计信息。以下是一个详细的步骤和完整的代码示例: 1.1步骤 (1)导入csv模块。 (2)打开CSV文件并读取数据。 (3)初始化一个空字典

[转帖]利用 libpcap 库进行流量统计与数据包分析

https://zhuanlan.zhihu.com/p/437187441 一、简介: Libpcap(Packet Capture Libray),即数据包捕获函数库。该库提供的C函数接口用于捕获经过指定网络接口的数据包,可以统计流量数据,可以添加过滤规则分析数据包数据内容。 Linux下的tc

[转帖]使用 BPF 统计网络流量

https://cloud.tencent.com/developer/article/1804036?areaSource=103001.17&traceId=rX8kmZPurwFtXqEtY-bY- 本文介绍使用 BPF 统计网络流量。网络流量是云产品的重要计费指标,服务器每秒可以处理上百万的

[转帖]009 Linux 文件大小统计与排序 (du 于 df 和 sort)

https://my.oschina.net/u/3113381/blog/5463932 01 du 与 df 作用与区别? Linux 最有用最常用的统计文件大小命令是什么?无疑就是 du 和 df 了。 du(disk usage) du 能看到的文件只是一些当前存在的,没有被删除的。 df(