比赛名称:IceCube - Neutrinos in Deep Ice
重建中微子从宇宙到南极的方向
比赛链接:https://www.kaggle.com/competitions/icecube-neutrinos-in-deep-ice
比赛类型:计算机物理
比赛背景
中微子是宇宙中最丰富的粒子之一。虽然类似于电子,但几乎无质量和电中性的中微子具有使它们难以检测的基本特性。如果可以使算法更快、更准确,就可以分析更多的中微子事件,甚至可能是实时分析,并大大增加识别宇宙中微子源的机会。快速检测可以使全世界的望远镜网络能够搜索更多的瞬态现象。
在过去十年中,研究人员开发了多种方法来重建中微子事件。然而,由于现有解决方案远非完美,因此出现了问题。它们要么速度快但不准确,要么以巨大的计算成本为代价更准确。
IceCube 中微子天文台是同类探测器中的第一个,包含一立方公里的冰,旨在寻找几乎没有质量的中微子。一个国际科学家小组负责构成 IceCube Collaboration 的科学研究。
比赛任务
本次比赛的目标是预测中微子粒子的方向。选手将根据“IceCube”探测器的数据开发一个模型,该探测器从南极冰层深处观察宇宙。
比赛模型可以帮助科学家更好地理解恒星爆炸、伽马射线暴以及涉及黑洞、中子星和中微子本身基本特性的灾难性现象。
评价指标
使用预测事件起源和真实事件起源之间的平均角度误差对提交进行评估。
对于测试集中的每个event_id,需要预测azimuth和zenith。该文件应包含标题并具有以下格式:
event_id,azimuth,zenith
730,1,1
769,1,1
774,1,1
etc.
数据描述
本次比赛使用隐藏的测试集,当提交的Notebook被评分时,实际测试数据(包括完整长度的示例提交)将提供给Notebook。预计在隐藏的测试集中看到大约一百万个事件,分为多个批次。
-
[train/test]_meta.parquet
- batch_id:批次 ID。
- event_id:事件 ID。
- [first/last]_pulse_index:属于此事件的特征数据帧中第一行/最后一行的索引
- [azimuth/zenith]:中微子的[azimuth/zenith] 角(以弧度为单位)
-
[train/test]/batch_[n].parquet:每个批次包含数以万计的事件。每个事件可能包含数千个脉冲,每个脉冲都是光电倍增管的数字化输出并占据一行。
- event_id:事件 ID
- time:当前事件时间窗口中脉冲的时间
- sensor_id:记录该脉冲的 5160 IceCube 光电倍增管传感器的 ID
- charge:脉冲中光量的估计
- auxiliary:如果为 True,则脉冲未完全数字化,质量较低,并且更有可能源自噪声。如果为 False,则此脉冲有助于触发决策,并且脉冲已完全数字化。
比赛赛程
- 2023年4月13日:组队截止日期。
- 2023年4月20日:最终提交截止日期。
赛题奖金
- 一等奖:18,000 美元
- 二等奖:12,000 美元
- 三等奖:10,000 美元
解题思路
赛题是一个非常规的赛题,需要考虑到赛题背景知识,也需要考虑到方案速度。因为赛题测试集包含非常多的样本,需要在有限时间内进行预测。
推荐思路:
- 加入物理知识的线性模型
- Treelite加速后的树模型
- 浅层的深度学习模型