KPI – Nível de Serviço


Bem lembrando KPI é um Indicador-chave de desempenho (Key Performance Indicator), mede o nível de desempenho do processo, focando no “como” e indicando quão bem os processos de tecnologia da informação permitem que o objetivo seja alcançado.

KPIs são “veículos de comunicação”. Permitem que os diretores  comuniquem a missão e visão da empresa aos mais baixos níveis hierárquicos, envolvendo diretamente todos os colaboradores na realização dos objetivos estratégicos da empresa.

Objetivo do Gerenciamento níveis de serviços :

  • Garantir que metas especificas para todos os serviços
  • Monitorar e melhorar a satisfação dos clientes
  • Garantir o que o cliente quer que seja entregue
  • Garantir a proatividade para melhorar os serviços com custos justificáveis para o negócio
  • Manter contato com o cliente para conhecê-lo cada vez mais

Podemos extrair as informações gerenciais que necessitamos para garantir a qualidade do processo. abaixo alguns indicadores de desempenho (KPI) :

  • Qual o percentual de metas de serviços atingidas ?
  • Qual o nível de satisfação do cliente e como melhorar ainda mais ?
  • Existe alguma melhoria nos níveis de serviços ?
  • Qual a frequência média de reuniões de revisão ?
  • Os serviços dentro do ANS têm contrato ou acordos de nível operacional necessários ?
  • A percepção sobre a melhoria dos serviços fornecidos estão cada vez melhor ?
  • Qual o percentual do ANS ameaçados ou metas não atingidas ?

fonte : livro mudar e inovar.

leia também : kpi gerenciamento de incidente

Gerenciamento de Eventos x Gerenciamento de Incidentes


Os processos de Gerenciamento de Eventos e Gerenciamento de Incidentes pertencem, ambos, ao livro da Operação de Serviços de TI, dentro da ITIL V3.

Neste artigo, cobriremos algumas diferenças entre estes processos, focando nos pontos que costumam causar mais dúvidas.

Gerenciamento de Eventos

Um evento pode ser definido como qualquer mudança de estado que tem importância para a gestão de um item de configuração (IC) ou serviço de TI. Em outras palavras, qualquer ocorrência dentro do escopo de TI que tenha relevância para a gestão dos serviços entregues ao(s) cliente(s).

Exemplos de eventos:

  • um usuário logou no sistema;
  • um backup agendado não ocorreu;
  • o sistema está sendo acessado pelo dobro de usuários do que o normal;
  • um usuário não autorizado acessou um local da rede;
  • um sistema está mais lento do que o normal;
  • excesso de ligações por engano para o servicedesk;
  • qualquer outro que tenha relevância para quem está gerindo os serviços de TI;

Como podemos perceber, um evento tem diversas naturezas, portanto devem ser categorizados por nomenclaturas como: normal; não usual, exceção, alerta, ou quaisquer outras classificações relevantes.

Os eventos são normalmente reconhecidos através de notificações criadas por ferramenta de monitoramento.
Continuar a ler

Gerenciamento de problemas em pequenas organizações


Nem sempre é fácil adaptar boas práticas a realidade em que estamos inseridos. Muitos fatores dificultam a aplicação do que está nos livros dentro de nossas organizações, e um deles é o porte da empresa. Asim também é com a biblioteca da ITIL: quando não existem recursos suficientes, equipes e pessoas para assumir todos aqueles papeis, o que fazer?

Abaixo sugestões do Fernando Palma – TI Expert , de como adotar o processo de Gerenciamento de Problemas em organizações que possuem uma pequena estrutura de TI.

Gerenciamento de Problemas
É o processo da operação de serviços que tem como principal objetivo identificar e propor soluções para a causa raiz de um ou mais incidentes. É um processo que tem natureza tanto reativa como proativa, enquanto a gestão de incidentes mantém o foco apenas no reativo da operação.

Problema:
é definido pela ITIL como a causa raiz desconhecida de um ou mais incidentes.

Realizada esta pequena revisão, seguem algumas dicas de como adotar o processo de gerenciamento de problemas em organizações pequenas. Este artigo parte do pressuposto que, dentro da organização de TI, apenas o processo de gerenciamento de incidentes é tratado como um processo formal. Gestão de mudanças e Liberação serão desconsiderados, com objetivo de simplificar a proposta.

  • Crie categorias bem definidas para os incidentes

Escolha uma boa arvore de categorias que ajude na identificação de tendências entre os registros dos incidentes. Caso exista um catálogo de serviços, ótimo: dele devem ser extraídas as categorias dos incidentes.

  • Responsabilize uma ou mais categorias a um líder ou profissional específico

Os lideres de sistemas irá ser o responsável por gerenciar os problemas relacionados a sistemas e o de operações por problemas desta natureza. Caso sua organização não conte com departamentos dentro de TI, delegue esta responsabilidade a especialistas/analistas.

  • O líder/profissional deve reunir sua equipe ao menos uma vez ao mês

Aqui está a principal dica deste artigo. Se você não tem equipe para trabalhar com gestão de problemas cotidianamente, pode ao menos trabalhar (formalmente) com as atividades deste processo ocasionalmente. Os lideres de cada departamento se reunirão uma vez ao mês, por exemplo, para discutir a gestão de problemas. Se não existem lideres, analistas exercem este papel (mesmo que sozinhos).

  • A equipe/profissional deve analisar as reincidências de falhas e incidentes graves

São os dois pontos principais que devem ser levados em consideração nestas reuniões: detectar incidentes que se repetiram e incidentes graves. Para ambos, a equipe deve investigar a causa raiz e discutir alternativas de ações que eliminem a possibilidade destas falhas para os próximos perídios. O líder de TI (gestor/coordenador) deve ser o mediador destas reuniões.

 Muitas vezes, pode ser necessário consultar membros de outras equipes na investigação da causa raiz do(s) incidente(s).

  • Registre as ações e definições de cada equipe/profissional

A opção escolhida pela equipe deve ser registrada e aprovada por todos os envolvidos.

  • Reporte os resultados

Crie indicadores para monitorar a eficácia e eficiência do seu processo, tais como: percentual de soluções propostas executadas com sucesso; taxa de redução de re-incidências e número de problemas diagnosticados por equipe/analista.

Fonte > Fernando Palma – Portal GSTI

Leia também : KPI – Nível de Serviço

Gerencia de Configuração – SysAdmin – Operação


A gerência de configuração oferece um conjunto de recursos que visa garantir a integridade das configurações de vários sistemas, serviços e infraestrutura envolvida, fazendo isto de forma ágil e automatizada.

Precisamos entender que a gerência de configuração é crítica para ambientes que estão crescendo ou que sejam de natureza complexa e heterogenia, é através dela que podemos trabalhar provisionamento, gerência de mudanças, gerência de configurações, deploy, documentação e muitas outras questões.

Hoje – na prática – conseguimos identificar que a maioria dos incidentes em um ambiente ocorrem pela falta de processos e procedimentos bem definidos, ou seja falha humana.

As vezes um sysadmin instala um pacote onde não devia ou mesmo remove um pacote que é dependência de outro, e por isso um terceiro pacote é removido parando por exemplo uma aplicação WEB – servidores linux.

Quando acontece isso e envolvendo uma cliente em potencial, e quando não se utiliza nenhuma ferramenta de gerência de configuração, um incidente que poderá afetar uma produtividade e o SLA de várias equipes que dependiam do sistema de controle de tickets por exemplo – o qual foi afetado pela remoção de pacotes para gerenciar suas demandas.

Se este cliente utilizasse alguma ferramenta de gerência de configurações, o pacote removido seria instalado novamente e os arquivos de configuração modificados seriam corrigidos voltando a versão correta, fazendo com que o ambiente voltasse a funcionar.

Temos certamente algumas vantagens ao trabalharmos com gerência de configuração, são elas:

  • Padronização do seu parque;
  • Distribuição centralizada das configurações;
  • Controle das configurações em seus servidores;
  • Rastreamento das mudanças em seus servidores;
  • Documentação instantânea a partir da construção das configurações;
  • Maior segurança e controle das aplicações em produção;
  • Facilidades para distribuir novas configurações para todo o parque de forma rápida;
  • Acelerar a criação de novos servidores;
  • Acelerar a configuração de novos serviços;

Ferramentas de Gerência de Configuração

Existem hoje diversas ferramentas open-source que podem nos ajudar a implantar gerência de configuração em nosso ambiente LINUX/UNIX.

Dentre as mais conhecidas temos:

  • Puppet
  • Chef
  • CFEngine
  • SpacheWalk (Redhat)

Abaixo vocês vão encontrar um link para uma wiki que faz algumas comparações entre as principais ferramentas open-source que fazem gerência de configurações.

Comparison of open source configuration management software

Além da gerência de configurações

Claro que a gerência de configuração sozinha não resolve todos os seus problemas,devemos criar processos bem definidos para orientar as ações da equipe de operações em seu parque, é recomendado que seja adotada uma ferramenta de gestão de demandas/tickets, pois isso facilita a abertura, acompanhamento e gerência de demandas, possibilitando ao final de um ciclo (semanal/mensal/bimestral) métricas que podem ser avaliadas para que você busque melhorá-las a cada ciclo. Adoção de uma ferramenta wiki (DOKUWIKI ou REDMINE) para estender a documentação, registrar os processos, procedimentos, ambientes e tudo mais o que for necessário, de forma ágil e rápida, necessitando apenas de um navegador, deixando tudo centralizado.

créditos: Guto Carvalho

Leia Também : Calculo de Serviço Disponibilidade

Fluxo de Atividade do Gerenciamento de incidente

Calculo de Serviço – Disponibilidade


Falando em modo grosseiro, para calcular a disponibilidade de um serviço , que utiliza na pratica ITIL utiliza-se a formula :

Tempo de Serviço acordado – downtime

————————————————– X 100%

Tempo de Serviço acordado

Se um serviço foi acordado 98% de disponibilidade durante os dias úteis das 07:00h as 19:00h, o serviço ficou indisponível por 2 horas , qual foi o percentual de disponibilidade ?

Resolução : (12h por dia x 5 dias uteis – 2h) / 60h = 96,66%

Analisando o Ciclo de vida Expandido do Incidentes

O que causa indisponibilidade em um serviço são incidentes – falhas nos componentes do serviço.  Nesse caso utilizamos uma técnica chamada análise do ciclo de vida expandido do incidente. Desta técnica podemos calcular TMPR, TMRS, TMEF e TMEIS. Calculando o TMRS avaliamos o desempenho das equipes de suporte para resolver incidente do serviço ou componentes. Quanto o TMEF e o TMEIS, mais confiável é o serviço ou componentes.

Para entender melhor :

Disponibilidade (Availability) : habilidade de um serviço, componentes ou algum item de configuração exercer sua função acordada quando requerida.

  • Esta disponibilidade é medida em percentual

 Confiabilidade (Reliability) : é a medida de quando tempo um serviço, componente ou item de configuração pode exercer sua função sem interrupção. Depende da qualidade do hardware, software ou aplicação.

  • Medida por Tempo Médio entre falhas (TMEF) e Tempo Médio entre incidentes de Serviço (TMEIS)

Sustentabilidade (Maintainability) : mede a rapidez que um serviço, componente ou item de configuração consegue ser restaurado para se estado normal depois de um falha.Para conseguir a sustentabilidade é necessário que a equipe de TI esteja apta para suportar o serviço.

  • Medida pelo Tempo Médio Para Reparo (TMPR).

Funcionalidade do serviço (Serviceability) : é a habilidade de um fornecedor externo em cumprir com os termos de seu contrato. Tem caso que este contrado inclui níveis acordados de disponibilidade, confiabilidade e sustentabilidade para suportar um serviço ou componente que ele entrega.

  • Normalmente o contrato inclui níveis de disponibilidade, confiabilidade e/ou sustentabilidade para suportar um serviço ou componente.

Esse post fala de forma básica sobre o processo gerenciamento de disponibilidade que tem como objetivo assegurar que o nível de disponibilidade de serviço entregue em todos os serviços é correspondido ou excede as necessidades atuais e futuras do negócio a um custo justificável.

Imagem autorizada por Rogerio Araujo

Implementação de uma Central de Serviços

KPI – Nível de Serviço

Fluxo de Atividade do Gerencimento de Incidente


Objetivo do gerenciamento de incidente é resolver os incidentes de maneira mais rápidas possível , diminuindo assim o impacto dos negócios. Um incidente pode ser uma falha de hardware, falha de software, link de telecom, etc .. na qual devem ser comunicados á central de serviços que fará o registro e o acompanhamento até seu fechamento, que dará com OK do usuário. O registro até o fechamento do incidente é chamado de ciclo de vida do incidente.

  Exemplo de fluxo de atividade do gerenciamento de incidente

figura do livro mudar e inovar

fonte : livro mudar e inovar

leia também : Processamento e Categorização de Incidente