Archive for the ‘Qualidade’ Category

Sobre artigo recente

01/07/2011

Li com inquietação o artigo de Wludarski et al. (Wludarski SC, Lopes LF, Berto E Silva TR, Carvalho FM, Weiss LM, Bacchi CE. HER2 testing in breast carcinoma: very low concordance rate between reference and local laboratories in Brazil. Appl Immunohistochem Mol Morphol. 2011 Mar;19(2):112-8)

Em princípio, entendi que não devia ficar sem um comentário, mas não me senti confortável de me manifestar à época, e é com imenso desconforto que o faço agora.

Coloquei-me no lugar dos autores, e tentei imaginar como conseguiram produzir tal peça, sem que qualquer desconforto transparecesse.

Coloquei-me no lugar dos referees, e tentei imaginar como deixaram passar esse artigo, na forma como está, sem imaginar o desconforto que sentiriam pessoas honestas trabalhando em seus pequenos laboratórios, de maneira artesal, mas meticulosa, e todas metidas dentro do saco comum de laboratórios locais discordantes da referência auto-pronunciada.

Coloquei-me no lugar dos editores, e que desconforto não sentiriam, fosse eu em lugar deles, ao ver que a anteriormente promissora Applied, serviu de veículo para a divulgação do artigo, na forma como está.

Com desconforto apercebi que pessoas de autores e editores se confundem.

Procurei uma revelação de eventuais conflitos de interesse, imaginando que tamanha destreza em desmoralizar de maneira geral os laboratórios locais, pudesse estar relacionada ao exercício de marketing e ganho de mercados, uma vez o laboratório da referência é laboratório privado, com interesses comerciais. Decepcionei-me com a revista: não encontrei qualquer menção a eventuais conflitos.

Para superar meu próprio desconforto em manifestar-me, visto que ninguém se manifestou ou comentou, preferi aguardar alguns acontecimentos. Saíram, por esses dias, os resultados da avaliação de proficiência do CAP, em relação ao ensaio do HER-2, que viemos conduzindo no nosso serviço, já pelo quarto ano consecutivo.

Os nossos resultados sempre foram “good” ou eventualmente “acceptable”. Nossos resultados 3+ sempre se correlacionaram com amplificação pelo FISH, no laboratório de referencia, exceto num caso, que a amplificação foi de 2,3 se me lembro bem de cabeça: os resultados da imunohistoquímica também foram negativos no laboratório de referencia do CAP. Do mesmo modo, nossos resultados negativos (0 ou 1+) sempre correlacionaram com FISH não amplificado no laboratório de referencia do CAP.

Se os resultados da avaliação de proficiência não me conferem autoridade para comentar o artigo de Wludarski e cols, pelo menos amenizam meu desconforto, e me permitem levantar alguns pontos:

– Há evidente vício de seleção da amostra estudada: a impressionante cifra de 67,6% de casos duvidosos, sugere que os casos duvidosos estavam sendo encaminhados ao laboratório da referência para realizar o FISH, situação que se aproveitou para repetir a imunohistoquímica. Por conter parcela maior de casos duvidosos, é de se esperar maior variabilidade dos resultados. Diga-se, na avaliação dos laboratórios pelo CAP, não me recordo, nestes quatro anos que participo, de um resultado 2+ consensual (em que pelo menos 80% dos participantes concordassem).

– A distinção dos resultados negativos (0 e 1+) não faz qualquer sentido, contribuindo para aumentar numericamente a discordância. Se forem considerados resultados 0/1+ em conjunto, a concordância sobe dos 171/500=34,2%, para 196/500=39,2%. Parece irrelevante, mas é mais honesto.

– A imunohistoquímica (mesmo a realizada em laboratório de referência) não é o padrão ouro, para a avaliação do HER-2. O padrão ouro ainda é o FISH. Comparar as imunos com as imunos, não é suficiente, mesmo com a concordância dos resultados 0, 1+ e 3+ com FISH não-amplificado e amplificado, respectivamente. Os casos 2+ são equívocos, duvidosos, tendem a variabilidade, expressam a limitação do método. Os casos 2+ chegaram a 37% (!) dos 1115 casos avaliados pela “referência” na validação da imuno em contraposição ao FISH. Essa margem de duvidosos e exclusão das polissomias do 17, podem mesmo ter contribuído para o índice de concordância de 98,4%. Ainda assim, 98,4% não é 100%. São 11 casos em que não há concordância de resultados: 5 pacientes candidatas a tratamento, correndo o risco de efeitos colaterais, sem qualquer efeito da medicação, e 6 em que o tratamento deixaria de ser indicado, pelo resultado discordante. Os resultados do trabalho indicam que entre os 500 casos “de fora” estudados, 27 pacientes estariam candidatas ao tratamento com uma medicação sem efeito sobre a doença, considerando o padrão ouro empregado pelos autores. Aí pode estar realmente um problema: pode haver uma tendência dos laboratórios em geral de superestimar a expressão do HER-2. Por outro lado, contudo, apenas 4 pacientes deixariam de receber o tratamento, mesmo com a possibilidade de resposta, se for considerado o padrão ouro empregado no trabalho. Na discussão, os autores falam que “This finding shows that some patients may potentially not be appropriately treated with trastuzumab”, esquecem de olhar para si próprios, e ver que 5 de 337 de seus próprios resultados foram falso-negativos (a “diferença” na frequência dos falso-negativos num e noutro caso deu um valor p=0,5, não significativo, portanto). De qualquer modo, são comparações feitas com diferentes padrões-ouro, em amostras com processos de seleção totalmente distintos, que é difícil imaginar a comparação.

Indago-me se todo o desconforto que sinto ao me manifestar sobre o assunto não são alvitre para que me abstivesse de fazê-lo.

Vejo-me impelido a fazê-lo, pelo exercício da liberdade, a busca epistemológica de uma verdade. Um processo de autoconsciência requer uma luta, aceitar o desconforto. Em outras palavras, entender a liberdade só é possível por meio de atos corajosos de resistência, requeridos para a autorreflexão. “Eles têm de se engajar nessa luta, pois eles têm de elevar sua certeza de ser para eles próprios à verdade … E é apenas por meio de apostar a própria vida que se ganha a liberdade… O indivíduo que não arriscou sua vida pode bem ser reconhecido como pessoa, mas não alcançou a verdade desse reconhecimento como uma autoconsciência independente (Hegel)”

O desconforto que ora enfrento surge não do embate de idéias, que realizo com galhardia, mas da responsabilidade que nos damos, ao oferecer um resultado a um paciente, sem que nada, se não minha própria consciência ao fazê-lo, me assegure de que vou estar certo. Não há controle interno ou externo, proficiência interna ou externa que nos serene, que nos assegure a certeza, a aproximação real da verdade. É desconfortável constatar que há aqueles que tratam essa aflição existencial autêntica com desprezo, estabelecendo a si próprios como padrão-ouro, conclamando a si a referencia da verdade, e reduzindo a verdade a apenas isso, a uma correspondência entre testes, que se validam como verdadeiros, mesmo contaminados por resultados falsos positivos ou negativos. Essas inverdades que surgem dos resultados e que reconhecemos nas taxas impessoais das validações que fazemos, mesmo embora poucas, por vezes elas nos surpreendem. Aí, no caso real, não é mais a taxa impessoal. O caso é pessoa, a quem tratamos com a ciência limitada que dispomos, é no caso, na pessoa, que convivemos com as nossas limitações.

O real não se revela por padrões-ouro, “nunca é o que se poderia achar, mas é sempre o que se deveria ter pensado”.

Há falsos resultados, positivos ou negativos, que se revelam somente no porvir, no desfecho do caso, na resposta ou não ao tratamento: “O pensamento empírico torna-se claro depois quando o conjunto de argumentos fica estabelecido. Ao retomar um passado cheio de erros, encontra-se a verdade num autêntico arrependimento intelectual” (Bachelard).

Esbarrar nas nossas limitações, no erro, expõe não apenas nossos próprios limites, mas os da ciência (da arte) que operamos. As técnicas em medicina surgem, são validadas na prática, na própria prática que as valida: ocupam parcialmente as enormes lacunas de conhecimento, que precisamos preencher, para responder ao menos parcialmente às nossas questões, à angústia dos pacientes por alguma conduta, que lhes rendam se não uma resposta, alguma esperança.

A imunohistoquímica surge como prática médica neste contexto. Acertos e erros são retrospectivamente avaliados, no curso em que pacientes são acertadamente ou não conduzidos. Na própria história da avaliação do HER-2, assisti a um curso ministrado pelo Dr. C. E. Bacchi, talvez no congresso de Brasília, em 1997, em que mencionava sua própria experiência com HER-2 após recuperação antigênica. Nas palavras dele, tamanha era a sensibilidade técnica, que era possível detectar a expressão da proteína resultante da expressão de cópias não amplificadas do gene, presentes no genoma de toda célula. O resultado era a expressão imunohistoquímica do HER-2 nas células não neoplásicas. A tendência hoje é interpretar a expressão no epitélio normal como erro de padronização, muito embora alguns recomendassem “ajustar” a reação no epitélio neoplásico, por aquela no epitélio normal (Cf. Khanafshar & Weidner – The Breast. In: Taylor & Cote Immunomicroscopy, 3rd ed.)

Operamos ajustes a todo tempo: há algum tempo, rotulávamos 2+ como positivo, hoje é duvidoso. Para aumentar a especificidade, ampliou-se a janela (de 10% para 30% das células) que comportava os exames duvidosos (2+) reduzindo-se a faixa dos casos positivos (3+). Há uma busca progressiva por melhora, mas as mudanças não nos atingem a todos ao mesmo tempo. Nesta busca, há ações que podem ser feitas, como a participação em avaliações de proficiência, e mais do que isso, a disponibilização de tais avaliações entre nós. Os dados gerados no laboratório da referência deveriam ter sido disponibilizados aos laboratórios locais, como ferramenta para eventual mudança, para acompanhar mais de perto um processo de melhoria contínua, sem atraso ou grande intervalo de tempo, entre o que se preconiza e o que se realiza.

A publicação do artigo, na minha interpretação, não indica compromisso com essa busca por melhora. Muito raramente recebo algum laudo do laboratório da referencia, de um caso que tenha sido por nós estudado. Até por coincidência, nestes dias recebi um caso em que discordamos na avaliação do HER-2. Tratava-se de paciente com carcinoma mamário ductal infiltrante, pouco diferenciado, grau 3. No meu estudo, resultado negativo, escore 0. Lá, resultado duvidoso, escore 2+. FISH não amplificado. A discordância com a imuno demonstra que não estou certo em relação a esse padrão-dourado. A concordância com a FISH demonstra que agora não estou errado. Estar certo ou errado em relação ao real, contudo, nem sempre é fácil ou possível de se definir de antemão.

O PICQ do PICQ

08/08/2009

Durante a auditoria para a acreditação, fomos indagados pelo auditor sobre que medidas de controle de qualidade dispúnhamos. Diferentemente do que é usualmente pretendido em sistemas de controle de qualidade, em que se buscam dados retrospectivos da confiabilidade dos estudos, disse que a nossa visão da qualidade era garantir que o estudo de cada caso resultasse, prospectivamente, na melhor avaliação patológica possível daquele caso. A melhor medida, neste sentido, é a revisão de todos os casos, pelo patologista sênior, antes da liberação dos resultados.

Também apresentamos a ele a nossa concepção do diagnóstico anátomo-patológico como uma atividade humana, contemplando dimensões cognitiva, comunicativa, normativa e de conduta, e que a elaboração e execução de um plano de ação para a solução de casos problemáticos podiam contribuir para delimitar as incertezas que são inerentes ao exercício da patologia.

A avaliação de todo o processo diagnóstico só é possível se obtivermos informações confiáveis sobre a evolução do caso, de modo que tenhamos uma alça de retroalimentação (feedback), a partir do desfecho de cada um dos pacientes sobre os quais exercemos a nossa ação diagnóstica. Essa retroalimentação pode ser a resposta a determinado tratamento, o resultado de algum outro exame laboratorial ou de imagem que dê suporte ao nosso diagnóstico, pode ser a evolução clínica esperada para a condição diagnosticada, o estudo morfológico ou molecular realizado por outros patologistas, na amostra que inicialmente avaliamos.

Em que pese analisarmos uma estrutura estática, um instantâneo da doença, representado, fixado em uma peça ou biópsia, o diagnóstico é dinâmico, uma vez que não se limita àquele instante do tempo, mas possibilita reconstruir uma sequência de acontecimentos passados, bem como apontar para uma cadeia de eventos no porvir, sobre a qual a conduta médica possa adequadamente intervir, de modo a modificar, prospectivamente, o caminho nem sempre inexorável dos acontecimentos.

A construção diagnóstica, portanto, não se limita aos elementos presentes naquela representação estática, oferecida pelo quadro morfológico, macro-, microscópico ou molecular: a interpretação desses elementos ocorre na medida em que tenhamos uma compreensão de toda a história clínica daquela doença, naquele doente. Na medida em que se desenvolve a história, novos elementos se adicionam à narrativa, que nos oferecem novas interpretações aos elementos passados. Essas novas interpretações só se possibilitam pelas alças de retroalimentação que nos levam a reavaliar a experiência diagnóstica, ora positivamente, ora negativamente.

Indagado pelo auditor, se participava do PICQ, sinceramente respondi que não, pelo menos não assiduamente, eventualmente respondia a um ou outro, mas não compreendia o PICQ como um programa de qualidade, apenas uma verificação de conhecimento, uma prova estudantil, que consumia um tempo grande, sem trazer um benefício que justificasse aquele esforço. Entre fazer o PICQ e escrever um artigo, por exemplo, considerava escrever um artigo mais relevante.

Ao momento, quase me arrependi, quando o auditor riu, impressionado com a minha sinceridade. Pensei, ora, Gil, não precisava ter respondido assim, tinha mesmo respondido à última edição, bastava que mostrasse a ele, naquele momento, o seu aproveitamento.

Já desde antes, vinha refletindo sobre o tema da qualidade. PICQ corresponde à sigla Programa de Incentivo ao Controle de Qualidade. Cada edição do PICQ (são quatro edições a cada ano) é formada por 32 questões de múltipla escolha, com quatro opções cada, o que daria em princípio, um conjunto de 128 afirmativas a ser verificadas, se corretas ou não. Acontece que uma opção pode conter – e frequentemente contém – uma sequência de afirmativas, multiplicando a necessidade de verificações.

Vejam por exemplo a questão 2 do caso 5, da edição 38, em que se solicita a alternativa incorreta:

A assertiva (a) contém várias afirmações:

O fibroma condromixóide é:
–         uma lesão benigna;
–         de ossos longos;
–         metafisária;
–         excêntrica;
–         bem delimitada;
–         tipicamente apresentando-se com dor.

A assertiva (b) apresenta várias afirmações em relação ao condrossarcoma:

–         São os sintomas mais freqüentes do condrossarcoma:
o       Dor
o       Aumento de volume
–         Apresenta
o       tipicamente expansão fusiforme metafisária ou diafisária
o       com erosão da cortical

A assertiva (c) apresenta afirmativas sobre o condroblastoma:

–         O condroblastoma é tipicamente uma lesão:
o       lítica
o       epifisária
o       com margem esclerótica
o       composta por:
–        células gigantes multinucleadas
–        condroblastos
–        células fusiformes

A assertiva (d) apresenta afirmativas sobre o fibromixoma (!?)

–         O fibromixoma (ou mixoma intra-ósseo) é uma lesão:
o       tipicamente de ossos longos
o       compostas por células
§       estreladas e
§       fusiformes
o       ? e arranjo lobulado

Quando me disponho a participar do PICQ, mais do que identificar a opção determinada como correta pela comissão, pratico o exercício de buscar garantias que abonem ou desabonem cada uma das afirmativas. Para muitas questões, é possível encontrar garantias conflitantes, que oferecem mais de uma solução a cada questão, conforme a fonte que se utilize.

Não tendo conseguido chegar a uma solução satisfatória para essa questão, apresentei a seguinte argumentação à comissão do PICQ:

–         A assertiva (a) embora conste como tal no fasciculo da AFIP, não está totalmente correta, já que não se pode afirmar que o fibroma condromixóide é uma lesão de ossos longos (45% dos casos ocorrem em ossos longos e o próprio caso de fibroma condromixóide apresentado no hálux, na questão 1 desse caso, contradiz a afirmação).

–         (b) Não encontrei referência ao aumento de volume como sintoma frequente no condrossarcoma.

–         (c) O condroblastoma “tipicamente” não apresenta células fusiformes: o fasciculo da AFIP nem menciona essa população celular. Rosai faz uma ressalva de que “spindle elements can be present”. O que deve ser interpretado como não típico da entidade.

–         (d) o fibromixoma ósseo existe? o fasciculo da AFIP menciona que o fibromixoma ósseo é o próprio fibroma condromixóide e portanto seria uma lesão de ossos longos, como afirmado na assertiva (a).

Recebi da comissão a resposta abaixo:

A alternativa “d” é claramente incorreta, uma vez que o fibromixoma, também chamado de mixoma intra ósseo é uma lesão tipicamente de mandíbula. O aspecto lobulado não é característica dessa lesão, e sim de lesões cartilaginosas, como o encondroma e fibroma condromixóide. Os principais diagnósticos diferenciais quando, excepcionalmente, essa lesão ocorre em ossos longos são o fibroma condromixóide e a displasia fibrosa mixóide. A propósito, o Dr. Unni afirma que a maioria dos relatos de fibromixoma fora da região mandibular são, na verdade, exemplos de displasia fibrosa mixóide.

Aumento de volume e dor são manifestações clássicas de condossarcoma, em contraposição ao encondroma, que não deve apresentar crescimento nem dor.

Quanto á localização típica do fibroma condromixóide, não nos parece que a localização em hálux contradiga a afirmativa, pois não foi afirmado que a lesão ocorre exclusivamente em ossos longos.

Quanto ao condroblastoma, as células fusiformes fazem parte do espectro morfológico dessa lesão, sendo importante esse conhecimento para que esses casos não sejam mal diagnosticados como lesões mais agressivas. Os casos de localização menos típica, como os condroblastomas temporais, podem também apresentar padrões morfológicos incomuns, até mesmo com predomínio de células fusiformes.

Não satisfeito com a resposta da comissão, apresentei um tréplica:

Na questão 2 do caso 5, por exemplo, a afirmação dada é de “dor e aumento de volume são os sintomas mais frequentes do condrossarcoma”; a sua consideração não apresenta nenhuma garantia de que isso esteja correto ou incorreto. Apenas menciona que são sintomas clássicos. Um sintoma pode ser clássico, embora incomum. A sua consideração cita uma contraposição ao encondroma, mas não há nada na questão que sugira a participação dessa entidade no raciocínio para se chegar a uma resposta correta.

Em relação a alternativa “a”, a sua afirmação: “Quanto á localização típica do fibroma condromixóide, não nos parece que a localização em hálux contradiga a afirmativa, pois não foi afirmado que a lesão ocorre exclusivamente em ossos longos”, não parece corresponder à frase “o fibromixoma é uma lesão benigna, de ossos longos…”, veja que não consta nenhum qualificador (“típica”), como o que a comissão apresenta na sua consideração. De fato, não foi afirmado que a lesão ocorre exclusivamente em ossos longos, foi afirmado que a lesão é de ossos longos. 

O contrário ocorre em relação à afirmativa “c”. Essa alternativa menciona os casos típicos “o condroblastoma é tipicamente”…, mas a consideração apresentada à minha dúvida dá a entender que “por fazerem parte do espectro morfológico do condroblastoma” o achado de células fusiformes não seria necessariamente típico da entidade. Sua consideração menciona casos menos típicos, o que parece contradizer o “tipicamente” apresentado na afirmativa do teste.

 A comissão compreende o fibromixoma ósseo como a mesma entidade do mixoma intraósseo. Mas afirma na mesma frase que casos de “displasia fibrosa mixóide” são diagnosticados por alguns como fibromixoma ósseo. Para outros, fibromixomas ósseos são exemplos de fibroma condromixóide sem o componente cartilaginoso claramente definido. Assim, a afirmativa oferecida pode estar incorreta ou não, na dependência do contexto em que venhamos a interpretar o termo fibromixoma.

A resposta que obtive à tréplica:

Agradecemos sua colaboração, mas acreditamos que já foram respondidos os seus questionamentos iniciais.

Não podemos, neste momento, nos estendermos em réplicas e tréplicas e dai em diante.

Suas ponderações serão discutidas em uma próxima reunião da Comissão do PICQ

Entendo as dificuldades de se manter um programa como o PICQ, ainda mais se muitos passarem a questionar respostas e respostas às respostas, por assim dizer, a querer receber e oferecer uma retroalimentação, como instrumento de avaliação da nossa eventual qualidade e da qualidade eventual dos nossos programas de incentivo ao controle de qualidade. Apenas pretendo apresentar a minha dificuldade pessoal de participar do programa, visto o tempo que me consome, estar a buscar garantias a cada uma das 32 opções de cada edição, que, como vimos, multiplicam-se em várias, na medida em que uma opção pode conter várias assertivas.

Em janeiro de 2008, tivemos uma boa discussão no PATOCITO, sobre o PICQ, despertada pelo nosso colega Flavio de Oliveira Lima, buscando conceituar o PICQ como um teste de proficiência externa, nas definições da ONA e da ANVISA. Na época, manifestei os meus sentimentos em relação ao PICQ, como uma tarefa volumosa, exigindo grande pesquisa na literatura, buscando encontrar a fonte, na qual foi baseada cada uma das assertivas apresentadas. Esse consumo de tempo não se traduz em um incentivo à qualidade. Na medida em que o PICQ torne-se um instrumento de avaliação externa, “o” teste, como disse o Flavio, abdicamos de uma circularidade, suprimimos uma alça de retroalimentação, transferindo essa avaliação a um instrumento, sem a prerrogativa de avaliar o instrumento que nos avalia. Sistemas de qualidade externa possuem uma lógica linear. Por exemplo, tenho de contratar uma empresa para certificar as temperaturas que medem os termômetros, mas ela simplesmente traz um termômetro, que deve(ria) estar certificado por um outro termômetro, por um outro termômetro, por um outro termômetro. Há percentual de erro aceitável para variação de uma ou outra medida, mas não sabemos dizer o quanto a nossa medição da temperatura varia em relação ao Supremo dos termômetros (se é que algum termômetro certificou-se cara a cara com Ele).

Em sistemas de qualidade, não se pode transferir externamente, indefinidamente, a fundamentação da qualidade. A qualidade só faz sentido se se reflete naquilo que se produz no dia a dia, no caso dos patologistas, o diagnóstico. Seria bem mais simples que um avaliador, ao invés de questionar toda a documentação sobre o lote da eosina, o POP da coloração, etc, simplesmente colocasse a lâmina no microscópico e avaliasse como ficou o processamento, a microtomia e a coloração. É esse o controle de qualidade. Melhor dizer ao técnico que ficou ótima a lâmina, ou que não ficou tão boa, do que preencher um formulário de não conformidade. Melhor dialogar no objetivo de se obter a melhor preparação histológica, do que tergiversar na investigação de uma causa raiz. Também essa busca pela causa raiz resulta de uma lógica linear. Problemas de apresentação complexa, por suas múltiplas interações possíveis podem não ter uma causa raiz definida, ou podemos chegar a soluções distintas, conforme a aproximação que fazemos do problema.

Na investigação sobre o PICQ, como instrumento de qualidade da patologia, é necessário avaliar a sua qualidade como instrumento. Avaliei as frequências de respostas dadas à edição 41. Em nenhuma questão, houve uma concordância de 100% dos patologistas em relação à resposta. Sem considerar a existência de uma alternativa correta, a maior concordância observada foi de 98% (questão 1, caso 6), e a menor foi de 39% (questão 2, caso 8). A concordância mediana ficou em 77,8%; com percentis de 25 e 75 respectivamente de 67,8% e 89,3%. Considerando a alternativa correta, oferecida pela comissão, a questão com menor índice de “acerto” teve a alternativa “correta” escolhida por apenas 27,5% (questão 3, caso 6), a com maior índice foi de 98% (questão 1, caso 6). Os valores da mediana e percentis 25 e 75 foram os mesmos.

O índice de concordância Kappa, pode ser uma boa medida para avaliar a acuidade do instrumento (tabela 1). Considerando uma frequência esperada de 25% para a alternativa correta (se o patologista escolhesse a resposta por chance), o índice kappa avalia o quanto a frequência de respostas observada varia em relação à esperada. Na edição 41, tivemos índice Kappa variando entre 0,03 (questão 3, caso 6) e 0,97 (questão 1, caso 6).

Tabela 1: Ìndice Kappa e grau de concordância nas questões da edição 41 do PICQ

Ìndice Kappa Concordância

Número de questões

%

<0,2 Fraca

2

6,3

0,2-0,4 Pobre

2

6,3

0,4-0,6 Regular

6

18,8

0,6-0,8 Moderada

9

28,1

0,8-1,0 Substancial

13

40,6

A concordância foi fraca (índice kappa até 0,2) em duas questões (6,25%). Na questão 3, caso 6, discutem-se aspectos da classificação do carcinoma de mama, em fenótipos basal e luminal, tratando-se de um tema ainda emergente na patologia. Na questão 2, caso 8, são discutidos aspectos citopatológicos de amostras citológicas em base líquida, que seguramente não é um método ainda amplamente difundido entre nós.

A concordância foi pobre (índice Kappa entre 0,2 e 0,4) em duas questões (6,25% do teste). Na questão 2, caso 1, são discutidas neoplasias neurais e melanocíticas, como o neurotequeoma, o nevo de Spitz, o mixoma da bainha do nervo e o perineurioma. Na questão 1, do caso 6, são apresentadas imagens citológicas e a baixa concordância não reflete um erro diagnóstico, mas uma sobreposição presente nas alternativas C e D, dado que citologicamente nem sempre é possível definir entre um fibroadenoma e uma lesão proliferativa epitelial.

O índice de concordância foi regular, (índice Kappa entre 0,4 e 0,6) em seis questões (18,75% do teste) (questão 4, caso 3; questão 4, caso 4; questão 3, caso 5; questão 4, caso 6; questão 3, caso 8; questão 4, caso 8). A ocorrência nas questões de número 4 pode se justificar pela característica dessa questão, que sempre procura abordar temas mais recentes, que exigem pesquisa na literatura, já que nem sempre constam nos livros-texto em patologia.

Concordância de grau moderado, com índice Kappa entre 0,6 e 0,8, foi observada em 9 questões (28,1% do teste). A concordância foi substancial  (índice kappa entre 0,8 e 1) em 13 (40,6% do teste).

Os resultados apresentados utilizam uma frequência esperada de 25%, uma estratégia conservadora, já que em determinadas questões, uma ou mais alternativas são claramente erradas, fazendo o patologista uma opção entre apenas 3 ou 2 alternativas, com frequências esperadas então de 33,3 ou 50%.

Os resultados das análises indicam que uma parcela das questões não teve boa concordância, no que se refere às respostas dos patologistas. Em 10 questões, o grau de concordância foi fraco, pobre ou apenas regular. É nesse ponto que o PICQ pode servir como um estímulo à qualidade, identificando eventuais fraquezas no conhecimento dos patologistas e, mesmo, na própria elaboração da edição.

Não havendo a possibilidade de se definir, a priori, onde está a dificuldade, se no teste ou nos testados, fica a sugestão de que questões com baixo índice de concordância não sejam utilizadas para a graduação no teste. Deste modo, o patologista pode identificar mais claramente o conhecimento que lhe falta, em relação a seus pares, distinguindo-o do conhecimento que falta à própria comunidade de patologistas, como um todo.

A distinção é relevante. Num campo de conhecimento vasto, como é a Patologia, é preciso estar sempre se atualizando, e a medida do conhecimento, não se pode determinar externamente, mas no interior da nossa comunidade de conhecimento. Sabe-se que a proficiência no PICQ leva em conta a média global de ‘acertos’ dos patologistas, mas não oferece ao patologista em que área específica o seu conhecimento está defasado em relação a seus pares.

O PICQ também deve ser integrado com outro instrumento de qualidade importantíssimo, oferecido atualmente pela SBP, que é a assinatura dos periódicos mais importantes da especialidade. Como ferramenta educativa, o PICQ deve estimular a consulta a esses periódicos de modo que aquela afirmativa possa ser verificada na própria fonte. A consulta pode ser mais ou menos dirigida, indicando a referência, ou palavras-chave para a pesquisa do assunto. Os temas das questões com baixo índice de concordância, que possam refletir um baixo conhecimento dos patologistas devem ser novamente testados, no futuro, de modo que se possa avaliar se o próprio teste representa mesmo um incentivo à qualidade.

O PICQ como instrumento importante de incentivo à qualidade, não pode se desvirtuar, na medida em torne-se um instrumento em si, exigido por normas externas, desvinculado da própria preocupação do patologista com a qualidade de seu trabalho. Sob o risco de se transformar em uma tarefa escolar e sem sentido, um para-casa que o patologista se vê obrigado a cumprir, sem mesmo compreender a razão daquela tarefa. Nessa situação, é possível que ajamos como estudantes de segundo grau, formando grupos, dividindo a tarefa, copiando as respostas uns dos outros.

Esse longo arrazoado em torno do PICQ procura trazer a tona uma discussão sobre os sistemas de controle de qualidade na patologia, não apenas do PICQ. É preciso que a comunidade de patologistas tome parte ativa nos programas de controle de qualidade, ao invés de submeter-se a exigências externamente estabelecidas. A atividade laboratorial da patologia tem um rígido controle de qualidade interno, exercido pelo próprio patologista, que vê a qualidade nas preparações histológicas que examina e percebe a qualidade das interpretações diagnósticas que emite, na repercussão de seu laudo, na comunidade de patologistas e na comunidade dos médicos assistentes. Como domínio de conhecimento, a patologia tem de operar de maneira congruente com os outros domínios do conhecimento (clínicos, radiológicos, cirúrgicos, moleculares, etc). Esse sistema de controle de qualidade da patologia existe desde que as bases celulares das doenças foram lançadas, na metade do século XIX. É preciso que saibamos fazer emergir essa qualidade, dando a ela uma visibilidade externa, assim criando possibilidade de uma verificação externa da qualidade. A verificação externa não deve ser a finalidade, apenas uma alça de retroalimentação para estímulo à qualidade do nosso trabalho no dia a dia.