赛题背景
随着互联网移动支付的迅速普及,我们享受到越来越多的生活便利。如当您走入商场的某家餐厅时,手机会自动弹出该餐厅的优惠券;当您走入商场服装店时,手机可以自动推荐这家店里您喜欢的衣服;在您路过商场一家珠宝店时,手机可以自动提示您想了很久的一款钻戒已经有货了;离开商场停车场时,手机在您的许可下可以自动交停车费。这些您所享受的贴心服务都离不开背后大数据挖掘和机器学习的支持。在正确的时间、正确的地点给用户最有效的服务,是各大互联网公司智能化拓展的新战场。
赛题
对赛题提供的数据进行店铺、用户、WIFI等各个维度进行数据挖掘和特征创建,并自行创建训练数据中的负样本,进行合适的机器学习训练。测试数据中,根据当时用户所处的位置和WIFI等环境信息,通过算法或模型准确的判断出用户当前所在的店铺。
本次大赛我们将提供在2017年8月份大概100家商场(复赛为2017年7-8月大概500家商场)的详细数据,包括用户定位行为和商场内店铺等数据(已脱敏),参赛队伍需要对其进行数据挖掘和必要的机器学习训练。另外,我们会提供2017年9月份的商场内用户数据来做评测,检测您的算法是否能准确的识别出当时用户所在的店铺。
这是一个室内定位问题。给定交易时的环境信息(包括GPS、wifi信息),确定交易所处的商铺。