教程
博客
开源案例
提问讨论
藏经阁
远方
英语
经济学
面经
缘来
登陆
首页
sql
数据结构
java
数仓建模
hive
flink
spark
数学
操作系统
hadoop
shell
发表新帖
数仓面试
king
VIP3
1年前
0
404
### 第一题 ml_group_info是一个qq群信息表,字段如下  假定我们有400万个群,被划分到了100个分类之中,每个群有1~500个用户不等,所有加过群的用户为5亿人。问题如下: 问题1、从每个分类中,随机抽取100个群的ID、名称、描述信息。 问题2、获取每个用户所加群名称列表,以逗号分隔。 问题3、针对每个群,计算出和其共同成员数最多的前50个群ID列表。
回帖
一个叫大佬的人
VIP3
写的挺好的,加油!
提交回复