ABC076 C - Dubious Document 2

備忘録

問題

atcoder.jp

回答

import sys
import os
import math
import bisect
import itertools
import collections
import heapq
import queue
import array

# 時々使う
# from scipy.sparse.csgraph import csgraph_from_dense, floyd_warshall
# from decimal import Decimal
# from collections import defaultdict, deque

# 再帰の制限設定
sys.setrecursionlimit(10000000)


def ii(): return int(sys.stdin.buffer.readline().rstrip())
def il(): return list(map(int, sys.stdin.buffer.readline().split()))
def fl(): return list(map(float, sys.stdin.buffer.readline().split()))
def iln(n): return [int(sys.stdin.buffer.readline().rstrip())
                    for _ in range(n)]


def iss(): return sys.stdin.buffer.readline().decode().rstrip()
def sl(): return list(map(str, sys.stdin.buffer.readline().decode().split()))
def isn(n): return [sys.stdin.buffer.readline().decode().rstrip()
                    for _ in range(n)]


def lcm(x, y): return (x * y) // math.gcd(x, y)


MOD = 10 ** 9 + 7
INF = float('inf')


def main():
    if os.getenv("LOCAL"):
        sys.stdin = open("input.txt", "r")

    S = iss()
    T = iss()

    ret = set()
    for i in range(len(S)-len(T)+1):
        for s, t in zip(S[i:i+len(T)], T):
            if s == t or s == '?': continue
            else: break
        else:
            tmp = ''
            if i != 0: tmp += S[:i]
            tmp += T
            if i+len(T) < len(S): tmp += S[i+len(T):]
            ret.add(tmp.replace('?', 'a'))

    if len(ret) == 0:
        print('UNRESTORABLE')
    else:
        print(sorted(list(ret))[0])


if __name__ == '__main__':
    main()

考え方

一致する文字列を探索する問題です。

  • 回答概要
    • iを始点、ti + 文字列Tの長さとしたとき、
      S[i:j] == Tとなる部分文字列の探索を行なう。
    • ケース数が少ないので、愚直に一致する文字列を全て生成する

文字列Sから文字列Tと一致する部分文字列を探索する問題です。
文字列Sから部分文字列を抜き出し、
文字列Tと一致する区間の探索を行ないます。

まず比較する文字の区間について考えます。
「文字列Tは文字列Sの連続する部分」です。
sを文字列Sの長さ、tを文字列Tの長さとしたとき、
文字列Tと比較を行う区間S[0:0+t], S[1:1+t], S[2:2+t], ... , S[s-t:s]です。

次に文字列の比較について考えます。
文字列は最長でも50文字のため、あまり効率化を考える必要はありません。
そのため、文字列Sから抜き出した区間の文字列と文字列Tを一文字ずつ比較を行います。

比較条件は2つの文字列を先頭文字から比較を行い、
異なる文字であった場合には、異なる文字列であるとします。
ただし、文字列Sから抜き出した文字列に?が含まれている場合には、
文字列Tはどのような文字でも許容されることに注意が必要です。