Eth-FDS研讨会系列

主要内容

在本网站上,您可以找到有关过去和即将推出的研讨会谈话以及可能的录像(见下文)标题)。

×

模态标题

模态内容

订阅这里如果您想通过电子邮件收到这些演示文稿。此外,你可以订阅到ICAL / ICS Calender。

秋季学期2021年

约会时间 扬声器 标题 地点
2021年9月23日
16:15-17:15
内森卡尔斯
康奈尔大学,纽约
活动详情

Eth-FDS研讨会

标题 平滑的情境匪徒:弥合参数和非可差异的遗憾制度
发言人,隶属关系 内森卡尔斯康奈尔大学,纽约
约会时间 2021年9月23日,16:15-17:15
地点 赫格F 3.
抽象的 背景强盗问题是在医疗保健,营销,收入管理和超越动态个性化决策中勘探和开发之间的固有权衡的主要课程。当然,权衡(即遗憾的最佳速度)取决于潜在的学习问题的复杂程度 - 在一个上下文中可以观察奖励的程度,告诉我们在另一个中的均值奖励 - 但这种明显的似乎似乎的关系不是由目前的理论支持。为了更确切地说,我们研究了一个非参数上下文强盗问题,其中预期的奖励功能属于具有平滑度参数β的Hölder类(大致意味着它们是β倍可分辨率)。我们展示了如何在先前在隔离研究的两个极端内插值:非微弱匪徒(β≤1),其中通过在不同上下文区域中运行单独的非上下文匪徒和参数 - 响应匪徒来实现速率最佳遗憾(β=∞),如果从一个语境到另一个语境的无限外带性,可以实现速率最佳遗憾。我们开发一种新颖的算法,仔细调整到其两者之间的任何平滑设置,并且我们证明其遗憾是通过建立匹配的上限和下限来最佳的,从而在两个极端恢复现有结果。从这个意义上讲,我们的工作弥补了现有文献之间的参数和非事实上的情境强盗问题的差距以及专门使用全局或本地信息的强盗算法,在动态决策中对复杂性和遗憾的关键相互作用进行脱落。纸质:https://arxiv.org/abs/1909.02553
平滑的情境匪徒:弥合参数和非可差异的遗憾制度阅读更多
赫格F 3.
11月11日11月11日
16:15-17:15
德米特里·耶拉多斯基
Skoltech教师,俄罗斯
活动详情

Eth-FDS研讨会

标题 标题T.B.A.
发言人,隶属关系 德米特里·耶拉多斯基Skoltech教师,俄罗斯
约会时间 11月11日11月16日,16:15-17:15
地点 赫格G
抽象的 TBA.
标题T.B.A.阅读更多
赫格G
2021年12月2日
16:15-17:15
Christophe Giraud.
巴黎萨莱大学
活动详情

Eth-FDS研讨会

标题 标题T.B.A.
发言人,隶属关系 Christophe Giraud.巴黎萨莱大学
约会时间 2021年12月2日,16:15-17:15
地点 赫格G
抽象的 TBA.
标题T.B.A.阅读更多
赫格G

注意:突出显示的活动标记下一个发生的事件。

浏览器中已禁用JavaScript