“Using counterfactual tasks to evaluate the generality of analogical reasoning in Large Language Models,” in arXiv (February 14, 2024), doi.org/10.48550/arXiv.2402.08955
“Comparing humans, GPT-4, and GPT-4V on abstraction and reasoning tasks, ” (Proceedings of the LLM-CP Workshop, AAAI 2024), arXiv (December 11, 2023), doi.org/10.48550/arXiv.2311.09247
“The ConceptARC benchmark: evaluating understanding and generalization in the ARC domain,” in Transactions on Machine Learning Research (August 2023), arXiv (May 11, 2023), doi.org/10.48550/arXiv.2305.07141
Podden och tillhörande omslagsbild på den här sidan tillhör Santa Fe Institute. Innehållet i podden är skapat av Santa Fe Institute och inte av, eller tillsammans med, Poddtoppen.