chess player robot
有一个只有下边界和左边界的无限大棋盘,棋盘上从左第1列开始到右第N列都有棋子(棋子的摆放规则是从第一行开始,向上连续摆)。
现有一个agent,可以沿着横线和竖线上下左右移动,在有棋子的地方,它可以捡起一个棋子放入自己的口袋、也可以直接走过;在没有棋子的地方,它可以放下一个棋子(如果它的口袋里面有棋子)、也可以直接走过。
怎样设计一种算法,让agent通过捡起和放下棋子(agent不会记录自己走了多少步、也不会记录自己身上有多少棋子),使棋盘上的棋子按照每一列上面的棋子数量排序,棋子最少的一列在最左边,棋子最多的一列在最右边。