Folgen
Błażej Mańczak
Błażej Mańczak
DynamoFL
Bestätigte E-Mail-Adresse bei dynamofl.com
Titel
Zitiert von
Zitiert von
Jahr
Codeit: Self-improving language models with prioritized hindsight replay
N Butt, B Manczak, A Wiggers, C Rainone, DW Zhang, M Defferrard, ...
arXiv preprint arXiv:2402.04858, 2024
192024
Hierarchical Reinforcement Learning for Power Network Topology Control
B Manczak, J Viebahn, H van Hoof
arXiv preprint arXiv:2311.02129, 2023
42023
Towards transparent and explainable attention models
KJ Kubara, B Manczak, B Dolicki, K Sawicz
ML Reproducibility Challenge 2021, 2020
22020
PrimeGuard: Safe and Helpful LLMs through Tuning-Free Routing
B Manczak, E Zemour, E Lin, V Mugunthan
ICML 2024 Next Generation of AI Safety Workshop, 2024
12024
Towards Self-Improving Language Models for Code Generation
M Defferrard, C Rainone, DW Zhang, B Manczak, N Butt, T Cohen
ICLR 2024 Workshop on Large Language Model (LLM) Agents, 0
Das System kann den Vorgang jetzt nicht ausführen. Versuchen Sie es später erneut.
Artikel 1–5