对于研究论文,我模拟了Channel 4 Program Countdown的字母回合。本质上,是由9个随机字母组成的棋盘,玩家必须尝试找到由尽可能长的字母组成的单词。
我当前正在使用代码:
for word in sowpods:
testboard = list(board)
count = 0
for letter in word:
if letter in testboard:
testboard.remove(letter)
count += 1
if len(word) == count:
length.append(len(word))
if len(length) == 0:
return 0
return max(length)
创建可以从板上创建的词典单词(导入到内核的SOWPODS .txt文件)列表,然后返回可能的最长单词以进行统计分析(这是模拟倒数轮功能的一部分) 。但是,从我的想象中,是由于重复的for循环,if语句和列表编辑,当按比例放大到500个左右的木板的较大样本时,这非常慢。有没有更有效的方法来检查是否可以从板上创建一个单词?
我尝试使用集合;我原来的测试是:
set(word) <= set(board)
但是此方法会被忽略,并且会重复,因此,例如,如果板子为[a,e,h,s,l,..),则尽管只有一个S可用,它仍会将“ Hassle”视为可能的单词。理想情况下,我会喜欢列表和集合之间的数据类型,其中顺序无关紧要,而相同元素的数量却无关紧要,但这似乎并不存在。
问题来源:stackoverflow
可以实现的一种加速方法是重新组织逻辑,以便在遇到不匹配的字母时逐字母循环结束。平均而言,这将与不允许的字母数成正比,从而加快代码的速度。
def wordsearch(board, sowpods):
length = []
for word in sowpods:
testboard = list(board)
count = 0
for letter in word:
if letter in testboard:
testboard.remove(letter)
count += 1
if len(word) == count:
length.append(len(word))
if len(length) == 0:
return 0
return max(length)
def find_matches(allowed, dictionary):
allowed_list = list(allowed)
match_words = []
for word in dictionary:
good = True
for letter in word:
if letter not in allowed_list:
good = False
break
if good == True:
match_words.append(len(word))
return max(match_words)
import timeit
start_time = timeit.default_timer()
allowed = 'iptneazol'
result = wordsearch(allowed, sb_list)
# code you want to evaluate
elapsed = timeit.default_timer() - start_time
print(elapsed)
>>>0.6867701730000135
start_time = timeit.default_timer()
allowed = 'iptneazol'
result = find_matches(allowed, sb_list)
elapsed = timeit.default_timer() - start_time
print(elapsed)
>>>0.10806877499999246
由于代码不会转换允许列表,因此这也解决了允许字母出现两次的问题。为了获得更高的效率,您可以将for循环重写为调用服务函数的列表理解,或者使用迭代器/生成器。
回答来源:stackoverflow
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。